Comparação Estatística de Algoritmos Evolutivos



Documentos relacionados
TÉCNICAS DE ANÁLISE DE DADOS

PLANEJAMENTO EXPERIMENTAL

DESENVOLVIMENTO DE UM SOFTWARE NA LINGUAGEM R PARA CÁLCULO DE TAMANHOS DE AMOSTRAS NA ÁREA DE SAÚDE

Pesquisa experimental

COMENTÁRIO AFRM/RS 2012 ESTATÍSTICA Prof. Sérgio Altenfelder

Controle estatístico de processo: algumas ferramentas estatísticas. Linda Lee Ho Depto Eng de Produção EPUSP 2009

Introdução. Métodos de inferência são usados para tirar conclusões sobre a população usando informações obtidas a partir de uma amostra.

PÓS GRADUAÇÃO EM CIÊNCIAS DE FLORESTAS TROPICAIS-PG-CFT INSTITUTO NACIONAL DE PESQUISAS DA AMAZÔNIA-INPA. 09/abril de 2014

Roteiro SENAC. Análise de Riscos. Planejamento do Gerenciamento de Riscos. Planejamento do Gerenciamento de Riscos

Teste de Hipótese para uma Amostra Única

)HUUDPHQWDV &RPSXWDFLRQDLV SDUD 6LPXODomR

Estratégias de Pesquisa

IV.4 Análise de Dados da Avaliação

MODIFICAÇÃO DO TESTE DE NORMALIDADE DE SHAPIRO-WILK MULTIVARIADO DO SOFTWARE ESTATÍSTICO R

Análise de Regressão. Tópicos Avançados em Avaliação de Desempenho. Cleber Moura Edson Samuel Jr

Introdução à análise de dados discretos

Evolução das Tecnologias. Projeto de Experimentos em Engenharia de Software. Agenda 10/9/09

ALTERNATIVA PARA SIMPLIFICAÇÃO NA ESTRUTURA DE EXECUÇÃO DE PROJETOS SEIS-SIGMA

AVALIAÇÃO DE IMPACTO NA PRÁTICA GLOSSÁRIO

Simulação Transiente

Otimização Aplicada à Engenharia de Processos

Introdução à Análise Química QUI 094 ERRO E TRATAMENTO DE DADOS ANALÍTICOS

Tecido A B

Especialização em Engenharia Clínica

Descobrimos que os testes 1, 2 e 7 foram os mais úteis para avaliação da estabilidade do gráfico Xbar na carta I:

Campus Capivari Análise e Desenvolvimento de Sistemas (ADS) Prof. André Luís Belini prof.andre.luis.belini@gmail.com /

Aula 5 Técnicas para Estimação do Impacto

Reflexões sobre Probabilidade, Estatística e Modelamento Matemático

Noções de Pesquisa e Amostragem. André C. R. Martins

Análise Exploratória de Dados

TÉCNICAS DE COLETA E ANÁLISE DE DADOS EM ARQUITETURA. Prof. MSc. Francisco Zacaron Werneck

Apresentação Prefácio da primeira edição Prefácio da segunda edição Introdução... 33

Introdução Visão Geral Processos de gerenciamento de qualidade. Entradas Ferramentas e Técnicas Saídas

7Testes de hipótese. Prof. Dr. Paulo Picchetti M.Sc. Erick Y. Mizuno. H 0 : 2,5 peças / hora

Nosso negócio é a melhoria da Capacidade Competitiva de nossos Clientes

O que é a estatística?

Aplicação do algoritmo genético na otimização da produção em indústrias de açúcar e álcool

Análise da incorporação do gerenciamento de riscos em projetos de delineamento de experimentos

BANCO CENTRAL DO BRASIL 2009/2010

APLICAÇÃO DA METODOLOGIA DoE UM PROCESSO DE FABRICAÇÃO DE DIAFRAGMAS DE FREIO. (Design of Experiments) EM. Carlos Eduardo GEHLEN Jordão GHELLER

Os Estilos de Pesquisa na Computação. TCC Profº Carlos José Maria Olguín

Roteiro SENAC. Análise de Riscos. Monitoramento e Controle de Riscos. Monitoramento e Controle de Riscos. Monitoramento e Controle de Riscos

Métodos de Síntese e Evidência: Revisão Sistemática e Metanálise

1. Avaliação de impacto de programas sociais: por que, para que e quando fazer? (Cap. 1 do livro) 2. Estatística e Planilhas Eletrônicas 3.

TTT-PLOT E TESTE DE HIPÓTESES BOOTSTRAP PARA O MODELO BI-WEIBULL. Cleber Giugioli Carrasco 1 ; Francisco Louzada-Neto 2 RESUMO

QUALIDADE DE SOFTWARE. Ian Sommerville 2006 Engenharia de Software, 8ª. edição. Capítulo 27 Slide 1

Aula 04 Método de Monte Carlo aplicado a análise de incertezas. Aula 04 Prof. Valner Brusamarello

Hipótese Estatística:

UNIDADE DE PESQUISA CLÍNICA Centro de Medicina Reprodutiva Dr Carlos Isaia Filho Ltda.

A avaliação da incerteza do tipo B. Segundo o Guia para Expressão da Incerteza na Medição (Joint Commitee for Guides

AULAS 13, 14 E 15 Correlação e Regressão

TÉCNICAS EXPERIMENTAIS APLICADAS EM CIÊNCIA DO SOLO

Revisão: Noções básicas de estatística aplicada a avaliações de imóveis

Planejamento - 7. Planejamento do Gerenciamento do Risco Identificação dos riscos. Mauricio Lyra, PMP

Atua no acompanhamento das atividades, através da implementação de políticas e normas; Busca a satisfação do cliente.

Gerenciamento de Projeto: Planejando os Riscos. Prof. Msc Ricardo Britto DIE-UFPI

7.Conclusão e Trabalhos Futuros

Modelagem e Simulação Material 02 Projeto de Simulação

Gerenciamento de Projetos Modulo VIII Riscos

Risco. Conceitos Básicos

Teoria da Mudança, Indicadores e Medição de Impacto

ANÁLISE DA INSPEÇÃO DA LARGURA DOS TECIDOS DE POLIPROPILENO DA INDÚSTRIA TÊXTIL OESTE LTDA

Modelagem e Simulação

FERRAMENTAS DE AVALIAÇÃO

Medidas e Incertezas

Avaliação de Desempenho de Sistemas

19/05/2010. Definições. Componentes. Tipos. Mensuração. Perfis de indivíduos. Gerenciamento

Aula 1. Introdução à Avaliação Econômica de Projetos Sociais

Instituto de Pesquisas Científicas de Pernambuco Av. José Magalhães de França, 564 Centro Arcoverde/PE CEP: Coordenação: Edivaldo

Engenharia de Software

Avaliação de Desempenho em Sistemas de Computação e Comunicação

Introdução a Química Analítica. Professora Mirian Maya Sakuno

PARTE I IMPORTÂNCIA DA INFORMAÇÃO PARA O MARKETING. TIPOLOGIA DOS ESTUDOS DE MERCADO

Tecnologia em Gestão Pública Desenvolvimento de Projetos - Aula 9 Prof. Rafael Roesler

Tópico 8. Estatística Inferencial Teste de Hipóteses

Aula 10 Testes de hipóteses

Capítulo 7 Estudos sobre Causalidade e Etiologia

Aplicação de algoritmos genéticos para ajuste de modelos regressores não lineares com grande número de parâmetros 1. Introdução

extreme Digital Television (XDTv): um método Ágil para o Desenvolvimento de Aplicações para TV Digital.

INF Introdução a Interação Humano-Computador (IHC)

Curso CPA-10 Certificação ANBID Módulo 4 - Princípios de Investimento

Segurança e Higiene no Trabalho

PESAGEM DE PREGOS EM BALANÇA ANALÍTICA

APLICACAÇÃO DE METRICAS E INDICADORES NO MODELO DE REFERENCIA CMMI-Dev NIVEL 2

Controle da qualidade off-line. Prof. André Jun Nishizawa Capítulo 5

PERGUNTAS MAIS FREQÜENTES SOBRE VALOR PRESENTE LÍQUIDO (VPL)

ipea A EFETIVIDADE DO SALÁRIO MÍNIMO COMO UM INSTRUMENTO PARA REDUZIR A POBREZA NO BRASIL 1 INTRODUÇÃO 2 METODOLOGIA 2.1 Natureza das simulações

Capítulo 2. Processos de Software Pearson Prentice Hall. Todos os direitos reservados. slide 1

AULAS 24 E 25 Análise de Regressão Múltipla: Inferência

Como Selecionar Projetos Seis Sigma

Herramientas inteligentes para el diagnóstico de transformadores sometidos a esfuerzos electromagnéticos severos

Tópicos Abordados. Pesquisa de Mercado. Aula 1. Contextualização

MINISTE RIO DA EDUCAÇA O UNIVERSIDADE FEDERAL DE LAVRAS DEPARTAMENTO DE CIE NCIAS EXATAS

Simulação Computacional de Sistemas, ou simplesmente Simulação

Tópicos Abordados. Pesquisa de Mercado. Aula 2. Contextualização. Qualitativa X Quantitativa. Instrumentalização. 1. Diferença entre qualitativa

Modelo de Rateio de Custo Operacional para Perfuratrizes

- Analisar e compreender a importância e a natureza da estatística no cotidiano;

Transcrição:

Comparação Estatística de Algoritmos Evolutivos Parte I: Planejamento Experimental Felipe Campelo fcampelo@ufmg.br Universidade Federal de Minas Gerais São Carlos 02 de Abril de 2012

Motivação Motivação Algoritmos evolutivos Metaheurísticas baseadas em processos evolutivos para a solução de problemas; Populações de soluções em potencial sujeitas às componentes básicas de um sistema evolutivo: hereditariedade, variação e pressão seletiva; Regras de transição probabilísticas - adaptação iterativa (e frequentemente implícita) da função de amostragem de um dado espaço.

Motivação Motivação Algoritmos evolutivos Natureza probabilística provável variação aleatória nos resultados. Avaliação objetiva de sistemas sujeitos a variação aleatória requer rigor estatístico Perguntas importantes: Quanto da variação observada é devida a diferenças reais entre métodos? Qual a real magnitude da diferença média entre métodos? Como quantificar o nível de confiança nos resultados?

Motivação Problemas metodológicos Experimentação descuidada To consult the statistician after an experiment is finished is often merely to ask him to conduct a post mortem examination. He can perhaps say what the experiment died of. - Sir Ronald Fisher Infelizmente ainda frequente na área de computação evolutiva; Mas não por muito tempo... Tende a produzir resultados fortemente enviesados em favor do algoritmo proposto

Motivação Problemas metodológicos Experimentação descuidada Algoritmo proposto Implementação cuidadosa e verificação de erros no código; Ajuste exaustivo dos parâmetros livres; Execução de diversas rodadas de experimentos; Algoritmo concorrente Implementação relativamente descuidada; Uso dos parâmetros da literatura ; Execução de uma única rodada de experimentos; Como sai no artigo: Os resultados apresentados representam a média de 30 execuções dos algoritmos.

Motivação Problemas metodológicos Experimentação descuidada Outros problemas: Falta de definição clara das perguntas que se deseja responder (hipóteses de teste); Falta de aleatorização experimental (em comparações de tempo de execução); Inversão da razão de experimentação: busca por mostrar que determinado método é melhor, ao invés de investigar se ele é melhor. Não replicabilidade;

Motivação Problemas metodológicos Análise inadequada ou descuidada Exemplo: comparação simples entre médias?

Motivação Problemas metodológicos Análise inadequada ou descuidada Exemplo: comparação simples entre médias?

Planejamento Experimental Teste de hipóteses Conceitos centrais Quantificação da confiabilidade dos resultados; Comparação da variabilidade intra-grupos com a entre-grupos; Embasamento para derivação de conclusões com confiança;

Planejamento Experimental Princípios fundamentais Planejamento de experimentos (DoE) Definição de protocolo para de coleta de dados de forma a possibilitar uma correta análise por ferramentas estatísticas, capazes de embasar conclusões válidas e objetivas. Aplicável a sistemas e processos sujeitos a ruído, erros experimentais, etc. Necessário para que as conclusões tenham significado; Evita a ocorrência de erros devidos a tendências pessoais e outros artefatos de experimentação e análise.

Planejamento Experimental Princípios fundamentais Planejamento de experimentos (DoE) Definição de protocolo para de coleta de dados de forma a possibilitar uma correta análise por ferramentas estatísticas, capazes de embasar conclusões válidas e objetivas. Replicação; Aleatorização; Blocagem; Derivação de conclusões que se referem a populações, e não apenas sobre a amostra em questão. P.ex., comparação por corrida versus planejamento experimental com blocagem;

Planejamento Experimental Hipóteses Estatísticas Hipóteses estatísticas Hipótese nula (H 0 ): Valor pontual para o parâmetro de interesse (µ = µ 0 ); Hipótese mais conservadora: ausência de efeito; Hipótese alternativa (H 1 ): Intervalo para o parâmetro de interesse: unilateral (µ < µ 0 ou µ > µ 0 ); bilateral (µ µ 0 ); Hipótese de presença de efeito observável;

Planejamento Experimental Tipos de Erros Erros em teste de hipóteses Erro tipo I (Falso positivo): rejeitar a hipótese nula quando esta é verdadeira; Erro tipo II (Falso negativo): falhar em rejeitar a hipótese nula quando esta é falsa;

Planejamento Experimental Tipos de Erros Erro tipo I Probabilidade de ocorrência α (nível de significância): α = P (erro tipo I) = P (rejeitar H 0 H 0 é verdadeira) Nível de significância região de aceitação; Nível de significância também é influenciado pelo tamanho amostral n;

Planejamento Experimental Tipos de Erros Erro tipo II Probabilidade de ocorrência β: β = P (erro tipo II) = P (não rejeitar H 0 H 0 é falsa) (1 β) - potência do teste; Requer uma especificação maior da hipótese alternativa;

Tipos de Erros Planejamento Experimental Erro tipo II

Planejamento Experimental Tipos de Erros Erro tipo II Potência do teste influenciada por diversos fatores: Controláveis: nível de significância, tamanho amostral; Não-controláveis: valor verdadeiro do parâmetro testado; Relacionado à probabilidade de erro tipo I; Se H 0 é falsa, quanto menor a amplitude da diferença (µ 0 µ 1 ), maior a probabilidade de erro tipo II (Mas menor é a importância do efeito)

Tipos de Erros Planejamento Experimental Considerações sobre erros estatísticos Erro tipo I (α) depende apenas da distribuição da hipótese nula - mais facilmente controlável; Erro tipo II (β) depende do valor verdadeiro do parâmetro - mais difícil de especificar e controlar; Rejeição de H 0 - conclusão forte; Falha em rejeitar H 0 - conclusão fraca; Falhar em rejeitar H 0 evidência em favor de H 0 ;

Planejamento Experimental Valor-p no Teste de Hipóteses Valor-p Valor-p: Menor nível de significância que levaria à rejeição de H 0 para os dados disponíveis; Probabilidade da estatística de teste assumir um valor tão ou mais extremo que o observado, se H 0 for verdadeira;

Planejamento Experimental Técnicas para Planejamento e Análise Experimental Problema-dependente Dependendo do que se deseja testar (pergunta estatística), requer-se um dado planejamento experimental; Um planejamento bem fundamentado tende a determinar de forma clara a técnica de análise utilizada; Pelo menos a forma geral dos testes Determinação da relação entre variabilidade intra-grupos e entre-grupos;

Planejamento Experimental Algumas referências de interesse DoE em Computação Evolutiva J.N. Hooker (artigos); Salvador García (artigos); Thomas Bartz-Beielstein (livro e artigos); Carrano, Takahashi, Wanner, A Multicriteria Statistical Based Comparison Methodology for Evaluating Evolutionary Algorithms, IEEE TEVC 2011. Estudo de Caso: Batista, Campelo, Guimarães, Ramírez, Pareto cone-epsilon dominance: improving convergence and diversity in multiobjective evolutionary algorithms, LNCS 2011.

Agradecimentos Planejamento Experimental CNPq - Conselho Nacional de Pesquisa e Desenvolvimento Tecnológico FAPEMIG - Funcação de Amparo a Pesquisa do Estado de Minas Gerais UFMG - Universidade Federal de Minas Gerais

Literatura recomendada Literatura recomendada 1 D.C. Montgomery, Design and Analysis of Experiments; 2 J.S. Kim, J.W. Kalb, Design of Experiments: An Overview and Application Example - http://goo.gl/ip08x 3 J. Trygg, Introduction to Statistical Experimental Design - http://goo.gl/zrscf 4 T. Brady, Reviewer s quick guide to common statistical errors in scientific papers, Elsevier - http://goo.gl/96qfk 5 F.L.H. Wolfs, APPENDIX E: Introduction to the Scientific Method - http://goo.gl/osgpu