10/09/2012. Preliminary Guidelines for Empirical Research in Software Engineering

Documentos relacionados
Artigo: Preliminary Guidelines for Empirical Research in Software Engineering

15 Congresso de Iniciação Científica AVALIAÇÃO DA RELAÇÃO ENTRE EFICÁCIA E CUSTO NA ATIVIDADE DE TESTE DE SOFTWARE

Redação Científica. Prof. Gilson Yukio Sato Departamento Acadêmico de Eletrônica Programa de pós-graduação em Engenharia Biomédica

Profs. Rosana Braga e Paulo C. Masiero ICMC-USP 1º. 2017

Parte I Visão Geral do Processo de Pesquisa 21. Capítulo 1 Introdução à Pesquisa em Atividade Física 23

Estatística Descritiva

Introdução à Revisão Sistemática

Revisão/Mapeamento Sistemático

LIKERT (EVA Discreta) - mais conhecida versão categórica alternativa à EVA. Porto Alegre/RS

Metodologia da Pesquisa em Sistemas de Informação. Aula 3. Projeto de Pesquisa. Revisão Sistemática. Profa. Fátima L. S. Nunes

1 Introdução, 1 2 Polo Epistemológico, 9 3 Polo Teórico, 25

A UTILIZAÇÃO DE MÉTODOS ESTATÍSTICOS NO PLANEJAMENTO E ANÁLISE DE ESTUDOS EXPERIMENTAIS EM ENGENHARIA DE SOFTWARE (FONTE:

MÉTODOS QUANTITATIVOS PARA CIÊNCIA DA COMPUTAÇÃO EXPERIMENTAL

PCS 5012 Metodologia de Pesquisa Científica em Engenharia de Computação

Métodos de pesquisa quantitativa e qualitativa para Ciência da Computação

Bioestatística UNESP. Prof. Dr. Carlos Roberto Padovani Prof. Titular de Bioestatística IB-UNESP/Botucatu-SP

Trabalho de Conclusão de Curso

Estatística. Professor Jair Vieira Silva Júnior.

Distribuição de Frequência de Variáveis Qualitativas e Quantitativas Discretas (Tabelas e Gráficos)

Procedimentos de Pesquisa em Ciências Sociais

Evidence-based Software Engineering

Pontifícia Universidade Católica do Rio Grande do Sul

AULA 07 Inferência a Partir de Duas Amostras

Metodologia de Dissertação II. Renata Lèbre La Rovere IE/UFRJ

QUI 154/150 Química Analítica V Análise Instrumental. Aula 1 Estatística (parte 1)

Análise de Regressão

04/04/2013. Ricardo Campos de Faria

RESOLUÇÃO Nº 01/2016

Método de Pesquisa: Estudo de Caso. Baseado no livro do YIN. Elaborado por Prof. Liliana

DELINEAMENTO EXPERIMENTAL [1]

PARTE I Os enfoques quantitativo e qualitativo na pesquisa científica

Estatística stica na Pesquisa Clínica

ESTRUTURA DO TCC ESTRUTURA DO TCC

Pesquisa Científica. Atividade da Aula Passada... Pesquisa Científica. Pesquisa Científica...

Aula 2 Uma breve revisão sobre modelos lineares

PROJETO DE PESQUISA CIENTÍFICA. Prof. Leonardo Bianco de Carvalho UNESP/Jaboticabal

1 Que é Estatística?, 1. 2 Séries Estatísticas, 9. 3 Medidas Descritivas, 27

Instituto Federal da Bahia Análise e Desenvolvimento de Sistemas INF022 Tópicos Avançados. Medição de Sofware

Trabalhode Conclusão de Curso 1 GSI535. Prof. Dr. Rodrigo Sanches Miani FACOM/UFU

Planejando um Estudo Parte 1

Introdução. SCC5921 Metodologia de Pesquisa em Visualização e Imagens. Prof. Fernando V. Paulovich

PREPARAÇÃO DE UM ARTIGO CIENTÍFICO

CURSO SUPERIOR DE TECNOLOGIA EM ANÁLISE E DESENVOLVIMENTO DE SISTEMAS DISCIPLINA : METODOLOGIA DA PESQUISA ASSUNTO: PESQUISA

Estatística Descritiva

Pesquisa Científica. Pesquisa Científica. Classificação das Pesquisas... Pesquisa Científica... Interpretar resultados. Realizar a pesquisa

TÓPICOS EM EDUCAÇÃO MATEMÁTICA MOMENTO 03. Universidade Federal Fluminense

Estatística Descritiva (I)

ESTATÍSTICA EXPERIMENTAL

Carlos Montanari Grupo de Química Medicinal NEQUIMED/IQSC/USP Departamento de Química e Física Molecular Instituto de Química de São Carlos

Desenvolvido pelo Software Engineering Institute-SEI em 1992 Possui representação por estágios (5 níveis)e contínua (6 níveis)

Considerações. Planejamento. Planejamento. 3.3 Análise de Variância ANOVA. 3.3 Análise de Variância ANOVA. Estatística II

1. ANÁLISE EXPLORATÓRIA E ESTATÍSTICA DESCRITIVA

CONTABILIDADE GERAL. Contabilidade - Noções Gerais. Estrutura conceitual básica parte 6. Valter Ferreira

Plano de Trabalho Docente Ensino Técnico

Métodos Quantitativos para Ciência da Computação Experimental

Gestão em Enfermagem. Profª Patricia Bopsin

Delineamento, Tipos de Pesquisa, Amostragem. Prof. Alejandro Martins

Bioestatística F Desenho de Estudos na Área da Saúde

Revisão Sistemática. Profa. Fátima L. S. Nunes. Semana do Livro 2018 EACH - USP. Profa. Fátima Nunes

AULA 01 Introdução. Ernesto F. L. Amaral. 09 de agosto de 2011 Avaliação de Políticas Públicas (DCP 046)

Métodos de Pesquisa. Prof. Dr. Marcelo Fantinato PPgSI EACH USP 2015

3 Metodologia. 3.1 Tipo de Pesquisa

Carga Horária: 80 horas (correspondem a aulas e atividades extra-classe)

SERG 2014 SEMIOTIC ENGINEERING RESEARCH GROUP

Estudo de Caso COMPOOTIM Parte I Criação da Linha

Visão Geral do Trabalho de Pesquisa

CURSO COMPLETO DE TEORIA DA CONTABILIDADE. Prof. Me. Luiz Felipe F. de Andrade

PROJETO E ANÁLISES DE EXPERIMENTOS (PAE) EXPERIMENTOS COM DOIS FATORES E O PLANEJAMENTO FATORIAL

1 Características Qualitativas Fundamentais da Informação Contábil-Financeira Útil

Estatística. Professor Jair Vieira Silva Júnior.

Teste estatístico de hipóteses. Seminário MAC6910 Marco Almada & Jainor Cardenas

Passos práticos: definir o objectivo do projecto identificar o tipo de projecto descrever o objectivo e procurar o tipo de teste indicado na tabela

Pesquisa na Educação. Professor: Jiyan Yari IFMS Campus Campo Grande - MS

6. Execução dos Procedimentos Substantivos

PLANO DE ENSINO. Apucarana Administração. Mauricio Barbosa da Silva Mestrado 4 anos

Estatística. O que é Estatística? Estatística pode ser: Estatística Descritiva. Ivonete Melo de Carvalho. Conteúdo

Conceitos centrais em análise de dados

Probabilidade e Estatística Prof. Dr. Narciso Gonçalves da Silva

ICET CURSO: Ciência da Computação e Sistemas de Informação (Engenharia de Software) Campus: Data: / / Nome:

Gerenciamento de Custos de Projetos. Parte 06. Gerenciamento de Projetos Espaciais CSE-301. Docente: Petrônio Noronha de Souza

Planejamento da pesquisa científica: incerteza e estatística. Edilson Batista de Oliveira Embrapa Florestas

Faculdade de Imperatriz FACIMP

REDIGINDO O RELATÓRIO DE PESQUISA

MEDIDAS DE POSIÇÃO E DE DISPERSÃO. Profª Andréa H Dâmaso

Aula 2: Planejamento da RS

Mestrado em Engenharia Alimentar. ISO (Métodos Quantitativos em melhoria de processos) Six Sigma

Objetivos. Métodos. Pergunta. Problema. Hipóteses. Conhecimento Científico. Planejando um estudo. Técnicas para verificar hipóteses

CORRELAÇÃO. Flávia F. Feitosa

Introdução a Métricas de Software

TIPOS DE PESQUISA. 1 Quanto à abordagem 1.1 Pesquisa qualitativa 1..2 Pesquisa quantitativa

Pesquisador. Planejamento de Experimentos Design of Experiments - DOE NOÇÕES SOBRE EXPERIMENTOS FATORIAIS. 1 - Fixar T e variar P até > Pureza

A ANÁLISE EXPLORATÓRIA DE DADOS ESPACIAIS: breve introdução José Irineu Rangel Rigotti

O Código de Ética e Conduta Profissional da ACM(Association for Computing Machinery) Código de Ética da ACM. Código de Ética da ACM

Prof. Domingos Sávio Giordani

Artículo Especial: Evaluación de la evidencia científica Albert J. Jovell Y Maria D. Navarro-Rubio Med Clin (Barc) 1995;105:

PROF. FÁBIO CAMPOS ARTIGO CIENTÍFICO

Qualidade de Software QUALIDADE DE SOFTWARE PRODUTO

NOÇÕES SOBRE EXPERIMENTOS FATORIAIS

Transcrição:

Preliminary Guidelines for Empirical Research in Software Engineering Kitchenham, B.A., Pfleeger, S.L., Pickard, L. M., Jones, P.W., Hoaglin, D.C., El-Emam, K., and Rosenberg, J. Aluna: Erica Rodrigues de Oliveira Professor: Eduardo Figueiredo Perfil dos autores 4 autores Pesquisadores em engenharia de software com conhecimento em estatística e ciência da computação Revisores Participam de pesquisa empírica Estatístico Aplica métodos estatísticos para resolução de problemas em Engenharia de Software (EngSoft) Médico estatístico Estatístico com interesse em software e computação Revisor 06 de setembro de 2012 2 Estudo empírico Estudo empírico em engenharia de software é o uso científicode dados quantitativos e qualitativos para entender e melhorar o produto de software e processo de desenvolvimento de software. Basili, V.; Elbaum, S. (2006) Better Empirical Science for Software Engineering. In: International Conference on Software Engineering. Introdução Padrão de pesquisa empírica em engenharia de software é pobre Esta afirmação não é uma crítica de pesquisadores de software em particular Alguns problemas em medicina "If researchers have difficulty in a discipline such as medicine, which has a rich history of empirical research, it is hardly surprising that software engineering researchers have problems Autores se concentraram em diretrizes médicas Médicos estatísticos têm apontado os baixos padrões de análise estatística em seus artigos Razões para erros estatísticos: Análise estatística é realizada por pessoas com um entendimento inadequado de métodos estatísticos Falta de conhecimento estatístico na comunidade de pesquisa 3 4 Diretrizes Criar diretrizes para auxiliar pesquisadores a evitar as principais armadilhas em suas atividades de pesquisa e apresentar suas pesquisas corretamente Método Baseadas em diretrizes médicas Adequado a estudos empíricos da Engenharia Software Diretrizes O que fazer e o que não fazer Contexto do experimento Projeto do experimento Condução do experimento e coleta de dados Análise Apresentação dos Resultados Interpretação dos Resultados 5 6 1

Contexto do Experimento Composto por três elementos: Informações contextuais sobre as circunstâncias industriais em que um estudo empírico ocorre ou em que uma nova técnica é desenvolvida Análise das hipóteses da pesquisa e como elas foram obtidas Informações sobre pesquisas relacionadas Garantir que os objetivos da pesquisa estão corretamente definidos Garantir que a pesquisa provê detalhes suficientes para outros pesquisadores C1: Certificar de especificar, o máximo possível, o contexto industrial. Em particular, definir claramente as entidades, os atributos e medidas que estão captando a informação contextual. Podem ser de dois tipos: Estudo por observação Identificar os fatores específicos que podem afetar a generalidade e a utilidade das conclusões (i.e. setor em que os produtos são usados) Replicação dos resultados em situações específicas DESAFIO: em EngSoftas medidas não são padronizadas (contagem por ponto de função, linha de código) Experimentos formais Visão geral do ambiente para identificar a melhor técnica (ou conjunto) a ser utilizada 7 8 C2: Se uma hipótese específica está sendo testada, indique-a claramente antes de realizar o estudo, e discuta a teoria a partir do qual ela é obtida, de modo que suas implicações sejam evidentes. C4: Descrever a pesquisa que é semelhante, ou tenha uma influência sobre a pesquisa atual e como o trabalho atual se relaciona com ela. C3: Se a pesquisa é exploratória, especifique de forma clara, e antes da análise dos dados, quais questões a investigação se destina a tratar, e como ela vai lidar com elas. Definir as questões de pesquisa com antecedência 9 10 Projeto do Experimento Descreve os produtos, recursos e processos envolvidos, incluindo: A população a ser estudada A lógica e técnica de amostragem da população O processo de atribuição e gestão dos tratamentos Os métodos utilizados para reduzir o viés e determinar o tamanho da amostra : Garantir que o projeto é apropriado para os objetivos do estudo. D1: Identificar a população a partir da qual sujeito e objeto são obtidos D2: Definir o processo pelo qual sujeitos e objetos foram selecionados Justificar o porque da escolha da amostragem Definir critérios de inclusão e exclusão D3: Definir o processo pelo qual sujeitos e objetos são atribuídos aos tratamentos (imparcialidade) D4: Restringir-se ao estudo de projetos simples ou, pelo menos, aos projetos que são completamente analisados na literatura. Se você não está replicando o projeto e análise de um estudo anterior, você deve consultar um estatístico para verificar se o seu é o projeto mais eficaz para o que você quer realizar. 11 12 2

D5: Definir a unidade experimental. D6: Para os experimentos formais, realize um préexperimento ou pré-cálculo para identificar ou estimar o tamanho mínimo necessário da amostra. D7: Utilizar níveis adequados de blinding. D8: Se você não puder evitar a avaliação do seu próprio trabalho, então explicite interesses pessoais (incluindo suas fontes de apoio), e relate o que você tem feito para minimizar o viés. D9: Evite o uso de controles, a não ser que se tenha certeza que a situação de controle pode ser claramente definida Exemplo: pedir um grupo para usar uma técnica de projeto novo e outra para não usar nenhuma técnica de projeto D10: Definir todos os tratamentos (intervenções) D11: Justificar a escolha das medidas de resultados em termos de sua relevância para os objetivos do estudo empírico 13 14 Condução do Experimento e Coleta de Dados A condução de um experimento envolve a coleta das medidas dos resultados experimentais. Problema: experimentos de software não são padronizados Garantir que o processo tenha sido bem definido para que o experimento possa ser replicado. Diretrizes para Coleta de Dados DC1: Definir totalmente todas as medidas de software, incluindo a entidade, o atributo, a unidade e as regras de contagem. Coleta de dados problemática pela falta de padronização Dificuldade de replicar estudos DC2: Para medidas subjetivas, apresente uma medida de concordância entre observadores. DC3: Descrever qualquer método de controle de qualidade usado para garantir a plenitude e precisão dos dados coletados. 15 16 Diretrizes para Coleta de Dados DC4: Para surveys, monitore e relate as taxas de resposta, e discuta a representatividade das respostas e o impacto das não respostas. DC5: Para estudos de observação e experimentos, registre dados sobre indivíduos que abandonam os estudos. DC6: Para estudos de observação e experimentos, registre dados sobre outras medidas de desempenho que podem ser afetadas de maneira adversa pelo tratamento, mesmo que elas não sejam o foco principal do estudo. Medicina: registro de dados de efeitos adversos de drogas Software: produtividade x taxas de defeito Análise Há duas abordagens para analisar os resultados dos experimentos: Análise clássica Análise bayesiana Utiliza informações/estudos anteriores Não é muito usada em estudos de engenharia de software Outra questão análise paramétrica: variáveis conhecidas não paramétrica: variáveis não conhecidas : Garantir que os resultados experimentais obtidos são analisados corretamente. 17 18 3

Análise Diretrizes A1: Especificar os procedimentos utilizados para controlar múltiplos testes. A2: Considerar o uso de análise blind. A3: Realizar análise de sensibilidade. Identificar e tratar outliers A4: Garantir que os dados não violam as suposições de testes utilizados neles Transformar os dados (teste t logaritmo) A5: Aplicar controle de qualidade apropriado para verificar os resultados It s not an opportunity to discard data or change values to favor your hypothesis. Apresentação dos resultados O leitor de um estudo deve ser capaz de compreender a razão do estudo, o projeto, a análise, os resultados e o significado desse estudo Também deve ser capaz de reproduzir ou replicar esse estudo Importante: detalhar os procedimentos utilizados 19 20 P1: Descrever ou citar uma referência para todos os procedimentos estatísticos utilizados. P2: Relatar o pacote estatístico utilizado. P3: Apresentar resultados quantitativos, assim como níveis de significância. Resultados quantitativos devem mostrar a magnitude dos efeitos e os limites de confiança. Exemplo: Relatar o valor da estatística t; Para a regressão, relatar a equação de regressão; Para a regressão relatar o coeficiente de determinação P4: Apresentar os dados brutos quando possível. Confirmar que eles estão disponíveis para revisões confidenciais pelos revisores e auditores independentes. P5: Fornecer estatística descritiva apropriada. Relatar o número de observações Relatar todos os números com o grau adequado de precisão. Apresentar o numerador e o denominador de porcentagens. Com números pequenos, apresentar valores e não porcentagens. Apresentar as medidas apropriadas de tendência central e dispersão quando resumir os dados contínuos. 21 22 P6: Fazer o uso adequado dos gráficos Erros comuns: Representação unidimensional de dados em duas ou mais dimensões Utilização de gráficos de pizza Escolha inapropriada da escala Omissão de pontos distantes em gráficos de dispersão Omitir dados em gráficos de dispersão, quando muitos pontos de dados se sobrepõem. Interpretação dos Resultados Todas as conclusões devem ser obtidas diretamente dos resultados Não se deve introduzir um novo material na seção de conclusões Qualificar os resultados apropriadamente 23 24 4

Interpretação dos Resultados Diretrizes I1: Definir a população na qual modelos estatísticos inferenciais e preditivos se aplicam Diretamente relacionado a D1 (identificar população) I2: Diferenciar entre significância estatística e importância prática I3: Definir o tipo de estudo Exemplos: observação, estudo em ambiente controlado, etc. I4: Especificar as limitações do estudo Validade interna e externa Resumindo Certifique-se de que o contexto é bem definido Descreva a relação de trabalhos anteriores Certifique-se de que o processo é repetível Verifique se o produto é reproduzível Documente o seu trabalho corretamente, se necessário consulte estatísticos Descreva e discuta a estabilidade e validade dos dados Conheça o seu experimento Utilize as métricas corretas Sempre que possível, apresente os dados brutos Use gráficos adequadamente 25 26 Conclusões Diretrizes apresentadas: Melhorar a qualidade da execução e da avaliação da pesquisa empírica Importância: Os pesquisadores de software geralmente cometem erros estatísticos Pesquisadores seniores estão pressionando por mais pesquisas empíricas para apoiar a engenharia de software Conclusões Pesquisadores podem melhorar suas pesquisas Revisores e leitores podem usar as diretrizes para avaliar a qualidade da pesquisa Algumas diretrizes podem ter implicações éticas e/ou metodológicas As diretrizes não são suficientes por si só 27 28 5