A UTILIZAÇÃO DE MÉTODOS ESTATÍSTICOS NO PLANEJAMENTO E ANÁLISE DE ESTUDOS EXPERIMENTAIS EM ENGENHARIA DE SOFTWARE (FONTE:
|
|
- Lorenzo Bernardes Tuschinski
- 7 Há anos
- Visualizações:
Transcrição
1 A UTILIZAÇÃO DE MÉTODOS ESTATÍSTICOS NO PLANEJAMENTO E ANÁLISE DE ESTUDOS EXPERIMENTAIS EM ENGENHARIA DE SOFTWARE (FONTE: ESELAW 09 MARCOS ANTÔNIO P. & GUILHERME H. TRAVASSOS) 1 Aluna: Luana Peixoto Annibal
2 OBJETIVO Apresentar técnicas estatísticas utilizadas no planejamento e análise de estudos experimentais em ES Breve introdução aos conceitos de estudos experimentais e estatística Indicações concretas da aplicabilidade destas técnicas Abordagem prática das técnicas estatísticas com exemplos reais 2
3 AGENDA Experimentação e ES O processo de experimentação Escalas numéricas e operações aplicáveis Tabulação, preparação e análise visual dos dados Medidas de tendência, dispersão e dependência Análise de outliers e quartis Testes estatísticos aplicáveis aos tipos de estudo Testes paramétricos e não paramétricos Exemplos 3
4 EXPERIMENTAÇÃO E ES As engenharias (Engenharia de Software) baseiam no uso de pesquisas científicas para construir produtos e serviços economicamente viáveis Pesquisas científicas Propostas inovadoras Avaliação dos resultados atingidos pela aplicação destas inovações 4
5 EXPERIMENTAÇÃO E ES Existem diferentes métodos de avaliação para pesquisa Métodos científicos Modelos são construídos a partir da observação do mundo Método de engenharia Técnicas atuais são analisadas, são identificadas fraquezas, inovações são propostas e comparadas com as técnicas anteriores Método experimental Modelos são construídos e avaliados através de estudos experimentais Método analítico Teorias formais são propostas e seus resultados são comparados com observações do mundo real 5
6 AGENDA Experimentação e ES O processo de experimentação Escalas numéricas e operações aplicáveis Tabulação, preparação e análise visual dos dados Medidas de tendência, dispersão e dependência Análise de outliers e quartis Testes estatísticos aplicáveis aos tipos de estudo Testes paramétricos e não paramétricos Exemplos 6
7 ESTUDOS EXPERIMENTAIS Identificação das variáveis Variáveis controláveis 7
8 ESTUDOS EXPERIMENTAIS Levantamento de objetivo e grupo de estudo Levantamento de Hipóteses e materiais de estudo Treinamento e execução pelos participantes Validação das hipóteses (análise estatística) 8
9 PLANEJAMENTO E HIPÓTESE Planejamento Formulação da hipótese Identificação das variáveis independentes (fatores) Elemento de causa Fatores variáveis controláveis Identificação das variáveis dependentes (resposta) Afetadas durante o processo de experimentação Seleção dos participantes Projeto de estudo Seleção dos métodos de análise Definição dos instrumentos Análise de ameaças (validity threats) 9
10 PLANEJAMENTO E HIPÓTESE Hipóteses Uma hipótese é uma teoria ou suposição que pode explicar um determinado comportamento de interesse da pesquisa Estudos experimentais tem como objetivo coletar dados em um ambiente controlado para rejeitar ou não uma hipótese Utilizando a técnica Y os desenvolvedores concluem a atividade de análise de requisitos em menos tempo e com um conjunto de requisitos mais completo do que utilizando a técnica X Variáveis independentes Técnica utilizada, caracterização dos desenvolvedores, caracterização da aplicação Variáveis dependentes Tempo de execução e % de requisitos correlatos encontrados 10
11 AGENDA Experimentação e ES O processo de experimentação Escalas numéricas e operações aplicáveis Tabulação, preparação e análise visual dos dados Medidas de tendência, dispersão e dependência Análise de outliers e quartis Testes estatísticos aplicáveis aos tipos de estudo Testes paramétricos e não paramétricos Exemplos 11
12 VARIÁVEIS E SEUS VALORES Variáveis podem ser qualitativas e quantitativas Os valores das variáveis são coletados em escalas Nominal Representa diferentes tipos de elementos Diferentes linguagens de programação Java, C++, C#, Pascal,...) Ordinal Representa diferentes tipos de elementos de maneira ordenada, mas sem qualquer interpretação numérica Diferentes níveis de CMMI (nível 1,..., nível5) Intervalar Distâncias são estabelecidas a partir de um zero arbitrário (ano zero zero absoluto) Escala de Likert (muito alto, alto, médio, baixo, muito baixo) impossível averiguar a distância entre esses no mundo real, mas assume-se que seja próxima Razão Seus valores permitem que interpretar razões, ordenações e distâncias (proximidade) entre o valores consecutivos Um software com X linhas é 2 vezes menor que um software com 2x linhas de código 12
13 VARIÁVEIS E SEUS VALORES Mais informação 13
14 VARIÁVEIS E SEUS VALORES Exemplo Utilizando a técnica Y os desenvolvedores concluem a atividade de análise de requisitos em menos tempo e com um conjunto de requisitos mais completo do que utilizando a técnica X Variáveis independentes Técnica utilizada Escala nominal Caracterização dos desenvolvedores e da aplicação Escala nominal ou ordinal Variáveis dependentes Tempo de execução Escala razão % de requisitos correlatos encontrados Escala razão 14
15 AGENDA Experimentação e ES O processo de experimentação Escalas numéricas e operações aplicáveis Tabulação, preparação e análise visual dos dados Medidas de tendência, dispersão e dependência Análise de outliers e quartis Testes estatísticos aplicáveis aos tipos de estudo Testes paramétricos e não paramétricos Exemplos 15
16 TABULAÇÃO DOS RESULTADOS Medidas de tendência central, dispersão e dependência podem ser utilizadas em conjunto com a análise gráfica para que o analista tenha um melhor entendimento sobre os dados 16
17 VISUALIZAÇÃO GRÁFICA São mais fácil e rápidos de entender em comparação a dados tabulados Cuidado com as conclusões Métodos do representação gráfica Histograma Histograma cumulativo Gráfico em pizza Diagrama de dispersão Cada eixo representa uma variável Identificação de outliers e sua possível eliminação Depende do tipo de variável: contínua ou discreta Gráfico de controle Observação do comportamento dos dados quantitativos Caracterizado por três linhas linha média, limite superior (ICL) e limite inferior (LCL) Comportamento sob controle valores oscilando em torno da linha média e dentro da faixa entre o UCL e o LCL 17
18 AGENDA Experimentação e ES O processo de experimentação Escalas numéricas e operações aplicáveis Tabulação, preparação e análise visual dos dados Medidas de tendência, dispersão e dependência Análise de outliers e quartis Testes estatísticos aplicáveis aos tipos de estudo Testes paramétricos e não paramétricos Exemplos 18
19 ESTATÍSTICA DESCRITIVA Descreve características relevantes dos dados coletados e sua distribuição Medidas de tendência central Média Somatório dos dados dividido por sua quantidade Mediana Valor do meio de um conjunto de dados Moda Valor de maior frequência (mais comum) Valor mínimo Valor máximo Percentil É o valor que divide a amostra na porcentagem X Quartil Os valores que representam a amostra no percentil 25%, 50% e 75% - respectivamente 1º, 2º e 3º quartil 19
20 MEDIDAS DE DISPERSÃO Faixa Diferença entre o maior e menor valor da amostra Variância Quão longe está do valor esperado Desvio padrão Raiz quadrada da variância 20
21 DISTRIBUIÇÃO DE FREQUÊNCIA Distribuições clássicas Normal, uniforme, beta... Distribuição normal Importante para alguns métodos estatísticos Formato de sino Pode-se levantar hipótese dessa distribuição ao analisar um histograma Curva Média Largura Desvio padrão 21
22 MEDIDAS DE DEPENDÊNCIA Quando duas ou mais variáveis estão relacionadas em um estudo, é útil calcular o grau de dependência entre elas Essas medidas determinam a força e a direção do relacionamento entre as variáveis Mais comum é o coeficiente de correlação Uma correlação de valor -1 Um alto valor em uma variável ocorre em conjunto com um baixo valor da segunda Uma correlação de valor 1 Um alto valor em uma variável ocorre em conjunto com um alto valor da segunda Uma correlação próxima a 0 Não podemos inferir nenhum relacionamento entre as variáveis 22
23 EXEMPLO DE CORRELAÇÃO 23
24 MEDIDAS DE CORRELAÇÃO Correlação de Pearson Quantifica a correlação entre duas variáveis Força de associação linear Aplicados a valores que parecem seguir uma distribuição normal Correlação de Spearman Baseia se no ranking dos valores coletados Aplicados aos valores que parecem não seguir uma distribuição normal Relação em formato de curva (não linear) 24
25 ANÁLISE DE REGRESSÃO Fornece uma equação que descreve a natureza do relacionamento Análise de Regressão Linear Simples Predizer o valor de variáveis dependentes baseado no valor de apenas uma variável independente 25
26 ESTATÍSTICA DESCRITIVA 26
27 AGENDA Experimentação e ES O processo de experimentação Escalas numéricas e operações aplicáveis Tabulação, preparação e análise visual dos dados Medidas de tendência, dispersão e dependência Análise de outliers e quartis Testes estatísticos aplicáveis aos tipos de estudo Testes paramétricos e não paramétricos Exemplos 27
28 REMOÇÃO DE OUTLIERS Outliers valores extremos Podem representar erros De aplicação, digitação, interpretação, etc São removidos antes de se aplicar as técnicas de inferência estatística É importante verificar sua origem Podem ser informações válidas Podem ser visualmente identificadas através de gráficos de dispersão e box-plots A uma distância X (percentil, desvio, quartil) da média ou mediana 28
29 AGENDA Experimentação e ES O processo de experimentação Escalas numéricas e operações aplicáveis Tabulação, preparação e análise visual dos dados Medidas de tendência, dispersão e dependência Análise de outliers e quartis Testes estatísticos aplicáveis aos tipos de estudo Testes paramétricos e não paramétricos Exemplos 29
30 TIPOS DE ESTUDOS EXPERIMENTAIS 30
31 TESES DE HIPÓTESE Definição das hipóteses Sempre lida com algum tipo de risco, que implica em um erro de análise Erro de tipo I O teste estatístico indica um relacionamento entre causa e efeito e o relacionamento real não existe Rejeita H0 quando esta é verdadeira Erro de tipo II Não indica relacionamento entre causa e efeito, mas existe este relacionamento Não rejeita H0 quando esta é falsa Hipótese Nula (H0) é normalmente construída de forma a minimizar erros do tipo I É a hipótese que o analista quer rejeitar com maior significância possível 31
32 TESES DE HIPÓTESE Procedimentos Fixar o nível de significância do tese (definir H0) Obter uma estatísticas que tenha distribuição conhecida sob H0 (estimador do parâmetro) Através das estatísticas de teste e do nível de significância, construir a região crítica Usando as informações amostrais, obter o valor da estatística (estimativa) Se valor da estatística pertencer à região crítica, rejeita-se H0, aceitando-se a hipótese alternativa Caso contrário, não se rejeita H0 e nada pode se afirmar a respeito sobre H1 32
33 NÍVEL DE SIGNIFICÂNCIA Indica a probabilidade de cometer um erro tipo I Os níveis de significâncias ( ) mais utilizados são 5%, 10%, 1%, 0.1% Chamado de p-value É o menor nível de significância que se pode rejeitar a hipótese nula 33
34 AGENDA Experimentação e ES O processo de experimentação Escalas numéricas e operações aplicáveis Tabulação, preparação e análise visual dos dados Medidas de tendência, dispersão e dependência Análise de outliers e quartis Testes estatísticos aplicáveis aos tipos de estudo Testes paramétricos e não paramétricos Exemplos 34
35 TIPOS DE TESE DE HIPÓTESE Dois grupos Testes paramétricos Utilizam fórmulas fechadas Presumem distribuições de frequência Seguem as premissas de normalidade e homocedasticidade (variáveis com variâncias similares) Teste não-paramétricos (menos poderoso) Não atendem aos pressupostos de teses paramétricos Presumem distribuições de probabilidade 35
36 PRÉ-TESTE PARAMÉTRICOS Teste de normalidade Teste de Shapiro-Wilk Calcula o valor W para avaliar se a amostra segue a distribuição normal Valor W pequeno indica não normalidade Utilizado com amostras com menos de 50 valores Teste de homocedasticidade Teste de Levene Considere uma variável Y, com N valores divididos em k grupos, onde Ni é o número de valores no grupo i O teste de Levene aceita a hipótese de que as variâncias são homogêneas se o valor W for menor do que o valor da distribuição F Os valores da distribuição F estão disponíveis em tabelas e softwares estatísticos 36
37 TIPOS DE TESE DE HIPÓTESE 37
38 AGENDA Experimentação e ES O processo de experimentação Escalas numéricas e operações aplicáveis Tabulação, preparação e análise visual dos dados Medidas de tendência, dispersão e dependência Análise de outliers e quartis Testes estatísticos aplicáveis aos tipos de estudo Testes paramétricos e não paramétricos Exemplos 38
39 EXEMPLO O exemplo baseia-se na análise da utilização de uma técnica para detecção de defeitos em requisitos de software Esta técnica foi desenvolvida originalmente na língua inglesa e tinha-se dúvida se deveria ser traduzida para o português para ser utilizada no contexto dos cursos de pós-graduação em engenharia de software da COPE/UFRJ Desta forma, o objetivo principal deste estudo experimental é verificar se existem diferenças significativas na utilização da técnica nas versões em inglês e português, em relação ao tempo, número de discrepâncias e defeitos encontrados 39
40 EXEMPLO Estudo experimental 19 participantes 2 grupos Primeiro grupo (EP) 11 participantes e técnica para o Inglês Segundo grupo (PP) 8 participantes e técnica para o Português 40
41 TESTE T Utilizado para duas amostras independentes Variáveis são quantitativas Não são conhecidas as variâncias populacionais Amostras independentes cada participante integrou exclusivamente um grupo As análises foram feitas utilizando o pacote estatístico SPSS 41
42 ANÁLISE PARA A VARIÁVEL TEMPO Outliers moderados Aparente grande variabilidade entre as duas amostras Mas a correta conclusão é obtida por um teste estatístico apropriado 42
43 ANÁLISE PARA A VARIÁVEL TEMPO O Teste T para duas amostras independentes exige que as amostras sigam uma distribuição normal Desta forma, tem-se um primeiro teste de hipótese a ser feito, considerando um nível de significância de 5%, sendo: H0: A distribuição é normal H1: A distribuição não é normal 43
44 TESTE DE NORMALIDADE Teste de Kolmogorov-Smimov para amostras com mais de 30 elementos Teste de Shapiro-Wilk para amostras com menos de 50 elementos No teste de Shapiro-Wilk, ambos os valores de significância (Sig) é superior a 0.05 (p-value 5%), portanto não há indícios para rejeitar H0 A distribuição da amostra para a variável Tempo é normal 44
45 TESTE DE HOMOCEDASTICIDADE Teste de Levene Teste de hipótese com um nível de significância de 5% H0: as variâncias são iguais ( 2 GrupoEP = 2 GrupoPP) H1: as variâncias são diferentes ( 2 GrupoEP 2 GrupoPP) Como o valor de significância assume valor maior que p- value (o.o5) então não rejeita H0 As variâncias são iguais 45
46 ANÁLISE PARA A VARIÁVEL TEMPO Teste paramétricos sobre a variável tempo Teste de hipótese com nível de significância de 5% H0: As médias são iguais (µgrupoep = µgrupopp) H1: As médias são diferentes Como o valor de significância Sig.(2-tailed) = para a condição de igualdade das variâncias é maior que o p-value (0.05). Assim não se rejeita H0 Concluindo-se que as médias são iguais Outra maneira é analisando que o valor zero está entre os valores superior e inferior do intervalo de confiança 46
47 CONCLUSÃO Não há diferenças significativas em relação à variável tempo na utilização de técnica de detecção de defeitos na suas versões em inglês em e em português para esse grupo de pesquisadores 47
48 REFERÊNCIA The Use of Statistical Methods for Planning and Analyzing Experimental Studies in Software Engineering Area Guilherme Horta Travassos (Associate Prof. - COPPE/UFRJ) and Marco Antônio Pereira Araújo (PhD COPPE/UFRJ). ESELAW 09 48
Métodos Estatísticos sticos Aplicados à Engenharia de Software Experimental
Métodos Estatísticos sticos Aplicados à Engenharia de Marco Antônio P. Araújo COPPE/UFRJ maraujo@cos.ufrj.br Márcio de O. Barros PPGI / marcio.barros@uniriotec.br Leonardo G. P. Murta COPPE/UFRJ murta@cos.ufrj.br
INTRODUÇÃO À ANALISE DE DADOS ESE. Prof. Paulo C. Masiero 1º. 2017
INTRODUÇÃO À ANALISE DE DADOS ESE Prof. Paulo C. Masiero 1º. 2017 Análise dos Resultados Se possível, entreviste os participantes para obter feedback: Sobre os artefatos Sobre o processo experimental
1 Que é Estatística?, 1. 2 Séries Estatísticas, 9. 3 Medidas Descritivas, 27
Prefácio, xiii 1 Que é Estatística?, 1 1.1 Introdução, 1 1.2 Desenvolvimento da estatística, 1 1.2.1 Estatística descritiva, 2 1.2.2 Estatística inferencial, 2 1.3 Sobre os softwares estatísticos, 2 1.4
Estimação e Testes de Hipóteses
Estimação e Testes de Hipóteses 1 Estatísticas sticas e parâmetros Valores calculados por expressões matemáticas que resumem dados relativos a uma característica mensurável: Parâmetros: medidas numéricas
Bioestatística UNESP. Prof. Dr. Carlos Roberto Padovani Prof. Titular de Bioestatística IB-UNESP/Botucatu-SP
Bioestatística UNESP Prof. Dr. Carlos Roberto Padovani Prof. Titular de Bioestatística IB-UNESP/Botucatu-SP Perguntas iniciais para reflexão I - O que é Estatística? II - Com que tipo de informação (dados)
Variância pop. * conhecida Teste t Paramétrico Quantitativa Distribuição normal Wilcoxon (teste dos sinais, Wilcoxon p/ 1 amostra)
Testes de Tendência Central (média, mediana, proporção) Classificação Variável 1 Variável 2 Núm ero Gru pos Dependência Teste Z Paramétrico Quantitativa - 1 - Premissas Variância pop. * conhecida Teste
Curso de Metodologia da Pesquisa em Ciências da Vida. Tópicos em bioestatística fundamentais para o pesquisador em Ciências da Vida
Tópicos em bioestatística fundamentais para o pesquisador em Ciências da Vida Conceito de bioestatística A bioestatística é um recurso matemático aplicado às ciências biológicas Tem por finalidade de coletar,
Bioestatística Básica
Bioestatística Básica Curso de Pós-Graduação RCA 5804 PROF. DR. ALFREDO J RODRIGUES DEPARTAMENTO DE CIRURGIA E ANATOMIA FACULDADE DE MEDICINA DE RIBEIRÃO PRETO UNIVERSIDADE DE SÃO PAULO alfredo@fmrp.usp.br
Correlação e Regressão
Correlação e Regressão Vamos começar com um exemplo: Temos abaixo uma amostra do tempo de serviço de 10 funcionários de uma companhia de seguros e o número de clientes que cada um possui. Será que existe
Estatística Descritiva. Objetivos de Aprendizagem. 6.1 Sumário de Dados. Cap. 6 - Estatística Descritiva 1. UFMG-ICEx-EST. Média da amostra: Exemplo:
6 ESQUEMA DO CAPÍTULO Estatística Descritiva 6.1 IMPORTÂNCIA DO SUMÁRIO E APRESENTAÇÃO DE DADOS 6.2 DIAGRAMA DE RAMO E FOLHAS 6.3 DISTRIBUIÇÕES DE FREQUÊNCIA E HISTOGRAMAS 6.4 DIAGRAMA DE CAIXA 6.5 GRÁFICOS
Estatística Descritiva
C E N T R O D E M A T E M Á T I C A, C O M P U T A Ç Ã O E C O G N I Ç Ã O UFABC Estatística Descritiva Centro de Matemática, Computação e Cognição March 17, 2013 Slide 1/52 1 Definições Básicas Estatística
METODOLOGIA DE INVESTIGAÇÃO CIENTÍFICA
METODOLOGIA DE INVESTIGAÇÃO CIENTÍFICA A FASE ANALÍTICA TCOR ENGEL SILVA COSTA costa.pms@ium.pt/226013 2 METODOLOGIA DE INVESTIGAÇÃO CIENTÍFICA Previamente ao início da recolha de dados, o investigador
Filho, não é um bicho: chama-se Estatística!
Paulo Jorge Silveira Ferreira Filho, não é um bicho: chama-se Estatística! Estatística aplicada uma abordagem prática FICHA TÉCNICA EDIÇÃO: Paulo Ferreira TÍTULO: Filho, não é um bicho: chama-se Estatística!
Estatística Descritiva
Estatística Descritiva ESQUEMA DO CAPÍTULO 6.1 IMPORTÂNCIA DO SUMÁRIO E APRESENTAÇÃO DE DADOS 6.2 DIAGRAMA DE RAMO E FOLHAS 6.3 DISTRIBUIÇÕES DE FREQUÊNCIA E HISTOGRAMAS 6.4 DIAGRAMA DE CAIXA 6.5 GRÁFICOS
ESTATÍSTICA DESCRITIVA. Aula 07 Estatística Descritiva
ESTATÍSTICA DESCRITIVA 2 Estatística Descritiva O que fazer com as observações que coletamos? Primeira etapa da análise: Resumo dos dados: organizar, descrever e resumir os dados coletados Estatística
Coleta e Modelagem dos Dados de Entrada
Slide 1 Módulo 02 Coleta e Modelagem dos Dados de Entrada Prof. Afonso C. Medina Prof. Leonardo Chwif Três Etapas Coleta Tratamento Inferência Coleta dos Dados 1. Escolha adequada da variável de estudo
Tópicos Extras 1ª parte. Testes Não Paramétricos, Análise Multivariada, Outras Técnicas
Tópicos Extras 1ª parte Testes Não Paramétricos, Análise Multivariada, Outras Técnicas 1 2 Técnicas de dependência 3 4 Situações Comparar 3 tipos de rede de computadores, C1, C2 e C3, em termos do tempo
Ficha da Unidade Curricular (UC)
Impressão em: 03-01-2013 17:12:18 Ficha da Unidade Curricular (UC) 1. Identificação Unidade Orgânica : Escola Superior de Tecnologia e Gestão Curso : [IS] Informática para a Saúde UC/Módulo : Bioestatística
Coleta e Modelagem dos Dados de Entrada
Coleta e Modelagem dos Dados de Entrada Capítulo 2 Páginas 24-52 Este material é disponibilizado para uso exclusivo de docentes que adotam o livro Modelagem e Simulação de Eventos Discretos em suas disciplinas.
Estatística Descritiva
Estatística Descritiva ESQUEMA DO CAPÍTULO 6.1 IMPORTÂNCIA DO SUMÁRIO E APRESENTAÇÃO DE DADOS 6.2 DIAGRAMA DE RAMO E FOLHAS 6.3 DISTRIBUIÇÕES DE FREQUÊNCIA E HISTOGRAMAS 6.4 DIAGRAMA DE CAIXA 6.5 GRÁFICOS
Estatística descritiva
Estatística descritiva Para que serve a estatística? Qual o seu principal objectivo? obter conclusões sobre a população usando uma amostra? População Amostragem Amostra Uma ou mais variáveis (X) são observadas
Delineamento e Análise Experimental Aula 3
Aula 3 Castro Soares de Oliveira Teste de hipótese Teste de hipótese é uma metodologia estatística que permite tomar decisões sobre uma ou mais populações baseando-se no conhecimento de informações da
ESTATÍSTICA. Tabelas e Gráficos. Elisabeti Kira - IME USP. Beti Kira (IME-USP) Estatística 18.abril.
ESTATÍSTICA Tabelas e Gráficos Elisabeti Kira - IME USP betikira@ime.usp.br Beti Kira (IME-USP) Estatística 18.abril.2017 1 / 26 Visão geral Coletar dados censo, técnicas de amostragem, amostra aleatória,
9 Correlação e Regressão. 9-1 Aspectos Gerais 9-2 Correlação 9-3 Regressão 9-4 Intervalos de Variação e Predição 9-5 Regressão Múltipla
9 Correlação e Regressão 9-1 Aspectos Gerais 9-2 Correlação 9-3 Regressão 9-4 Intervalos de Variação e Predição 9-5 Regressão Múltipla 1 9-1 Aspectos Gerais Dados Emparelhados há uma relação? se há, qual
Introdução. Amostragem, amostra aleatória simples, tabela de números aleatórios, erros
Estatística Aplicada 2007/2008 Programa Introdução às probabilidades. Distribuições. Amostragem. Testes de hipóteses. Análise da variância. Estatística não-paramétrica. Testes de ajuste do qui-quadrado.
POPULAÇÃO X AMOSTRA INTRODUÇÃO À BIOESTATÍSTICA TIPOS DE VARIÁVEIS CLASSIFICAÇÃO DAS VARIÁVEIS CLASSIFICAÇÃO DAS VARIÁVEIS 1) TIPOS DE VARIÁVEIS
POPULAÇÃO X AMOSTRA INTRODUÇÃO À BIOESTATÍSTICA População (N) representa o conjunto de todas as unidades experimentais que apresentam características em comum Amostra (n) representa uma parte do todo.
CORRELAÇÃO. Flávia F. Feitosa
CORRELAÇÃO Flávia F. Feitosa BH1350 Métodos e Técnicas de Análise da Informação para o Planejamento Junho de 2015 Revisão Inferência Estatística: Método científico para tirar conclusões sobre os parâmetros
MÉTODOS QUANTITATIVOS APLICADOS. Prof. Danilo Monte-Mor
MÉTODOS QUANTITATIVOS APLICADOS Prof. Danilo Monte-Mor Métodos Quantitativos Aulas 1 e 2 Análise Exploratória de Dados 2 Danilo Soares Monte Mor Currículum Vitae Prof. Dr. e especialista em Métodos Quantitativos
Estatística. Professor Jair Vieira Silva Júnior.
Estatística Professor Jair Vieira Silva Júnior Ementa da Disciplina Estatística descritiva; Interpretação de gráficos e tabelas; Amostras, representação de dados amostrais e medidas descritivas de uma
Exploração e Transformação de dados
Exploração e Transformação de dados A DISTRIBUIÇÃO NORMAL Normal 99% 95% 68% Z-score -3,29-2,58-1,96 1,96 2,58 3,29 Normal A distribuição normal corresponde a um modelo teórico ou ideal obtido a partir
Estatística 1. Resumo Teórico
Estatística 1 Resumo Teórico Conceitos do Curso 1. Tipos de Variáveis e Representações Gráficas a. Tipos de Variáveis b. Distribuição de Frequências c. Histograma 2. Estatística Descritiva Medidas Estatísticas
MOQ-13 PROBABILIDADE E ESTATÍSTICA. Professor: Rodrigo A. Scarpel
MOQ-13 PROBABILIDADE E ESTATÍSTICA Professor: Rodrigo A. Scarpel rodrigo@ita.br www.mec.ita.br/~rodrigo Programa do curso: Semanas 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 e 16 Introdução à probabilidade (eventos,
Modelos de Regressão Linear Simples - Análise de Resíduos
1 Modelos de Regressão Linear Simples - Análise de Resíduos Erica Castilho Rodrigues 27 de Setembro de 2016 2 3 O modelo de regressão linear é dado por 3 O modelo de regressão linear é dado por Y i = β
Medidas resumo numéricas
Medidas descritivas Medidas resumo numéricas Tendência central dos dados Média Mediana Moda Dispersão ou variação em relação ao centro Amplitude Intervalo interquartil Variância Desvio Padrão Coeficiente
Modelos de Regressão Linear Simples - Análise de Resíduos
Modelos de Regressão Linear Simples - Análise de Resíduos Erica Castilho Rodrigues 1 de Setembro de 2014 3 O modelo de regressão linear é dado por Y i = β 0 + β 1 x i + ɛ i onde ɛ i iid N(0,σ 2 ). O erro
Cap. 6 Medidas descritivas
Estatística Aplicada às Ciências Sociais Sexta Edição Pedro Alberto Barbetta Florianópolis: Editora da UFSC, 2006 Cap. 6 Medidas descritivas Análise descritiva e exploratória de variáveis quantitativas
Estatística stica na Pesquisa Clínica
Estatística stica na Pesquisa Clínica Thaïs s Cocarelli Sthats Consultoria Estatística stica NAPesq (HC-FMUSP) Alguns conceitos Estudos observacionais e experimentais Exploração e apresentação de dados
ANÁLISE ESTATÍSTICA DA RELAÇÃO ENTRE A ATITUDE E O DESEMPENHO DOS ALUNOS
ANÁLISE ESTATÍSTICA DA RELAÇÃO ENTRE A ATITUDE E O DESEMPENHO DOS ALUNOS Nível de significância No processo de tomada de decisão sobre uma das hipóteses levantadas num estudo, deve-se antes de tudo definir
Regressão linear simples
Regressão linear simples Universidade Estadual de Santa Cruz Ivan Bezerra Allaman Introdução Foi visto na aula anterior que o coeficiente de correlação de Pearson é utilizado para mensurar o grau de associação
AULA 06 Correlação. Ernesto F. L. Amaral. 04 de outubro de 2013
1 AULA 06 Correlação Ernesto F. L. Amaral 04 de outubro de 2013 Centro de Pesquisas Quantitativas em Ciências Sociais (CPEQS) Faculdade de Filosofia e Ciências Humanas (FAFICH) Universidade Federal de
ESTATÍSTICA: UMA RÁPIDA ABORDAGEM Prof. David B.
ESTATÍSTICA: UMA RÁPIDA ABORDAGEM Prof. David B. I - ESTATÍSTICA DESCRITIVA Vamos partir do pressuposto que nosso trabalho de pesquisa se voltará para realizar uma Simulação de eventos discretos. Para
Prova de Estatística
Prova de Estatística 1. Para um número-índice ser considerado um índice ideal, ele precisa atender duas propriedades: reversão no tempo e o critério da decomposição das causas. Desta forma, é correto afirmar
Estatística Descritiva (I)
Estatística Descritiva (I) 1 O que é Estatística Origem relacionada com a coleta e construção de tabelas de dados para o governo. A situação evoluiu: a coleta de dados representa somente um dos aspectos
Conceitos básicos Revisão de estatística descritiva
Conceitos básicos Revisão de estatística descritiva Prof. Marcos Vinicius Pó Métodos Quantitativos para Ciências Sociais Alguns conceitos básicos População: é o conjunto de todos os elementos ou resultados
Eng a. Morgana Pizzolato, Dr a. Aula 02 Revisão de Estatística DPS1037 SISTEMAS DA QUALIDADE II ENGENHARIA DE PRODUÇÃO CT/UFSM
Eng a. Morgana Pizzolato, Dr a. Aula 02 Revisão de Estatística DPS1037 SISTEMAS DA QUALIDADE II ENGENHARIA DE PRODUÇÃO CT/UFSM TÓPICOS DESTA AULA Revisão de Estatística Coleta de dados Análise de dados
SUMÁRIO. Prefácio, Espaço amostrai, Definição de probabilidade, Probabilidades finitas dos espaços amostrais fin itos, 20
SUMÁRIO Prefácio, 1 3 1 CÁLCULO DAS PROBABILIDADES, 15 1.1 Introdução, 15 1.2 Caracterização de um experimento aleatório, 15 1.3 Espaço amostrai, 16 1.4 Evento, 17 1.5 Eventos mutuamente exclusivos, 17
Regression and Clinical prediction models
Regression and Clinical prediction models Session 6 Introducing statistical modeling Part 2 (Correlation and Linear regression) Pedro E A A do Brasil pedro.brasil@ini.fiocruz.br 2018 Objetivos Continuar
CAPÍTULO 4 DESCRIÇÃO E EXPLORAÇÃO DOS DADOS 2ª parte
CAPÍTULO 4 DESCRIÇÃO E EXPLORAÇÃO DOS DADOS 2ª parte 4.3 Medidas de posição 4.4 Medidas de dispersão 4.5 Separatrizes Prof. franke 2 Vimos que a informação contida num conjunto de dados pode ser resumida
Sumário. CAPÍTULO 1 Conceitos preliminares 1. CAPÍTULO 2 Descrição de dados: análise monovariada 47
CAPÍTULO 1 Conceitos preliminares 1 Introdução........................................................1 O que é estatística?.................................................. 4 Papel dos microcomputadores.........................................
Capítulo 1. Análise Exploratória de Dados
Capítulo 1 Análise Exploratória de Dados Introdução A finalidade da Análise Exploratória de Dados (AED) é examinar os dados previamente à aplicação de qualquer técnica estatística. Desta forma o analista
Conceitos centrais em análise de dados
Conceitos centrais em análise de dados Conceitos básicos em Estatística Estatística Ciência que tem por objetivo orientar a coleta, o resumo, a apresentação, a análise e a interpretação dos dados. Divide-se
Importância da estatística 17. O que é a Estatística? 18
Índice MENSAGEM DO AUTOR 11 AGRADECIMENTOS 13 Capítulo 1 Introdução Importância da estatística 17 O que é a Estatística? 18 Escalas de medida 19 Escala de medida qualitativa ou não métrica 19 Escalas Nominais
UNIVERSIDADE LUSÍADA DE LISBOA. Programa da Unidade Curricular ANÁLISE E TRATAMENTO DE DADOS Ano Lectivo 2013/2014
Programa da Unidade Curricular ANÁLISE E TRATAMENTO DE DADOS Ano Lectivo 2013/2014 1. Unidade Orgânica Ciências da Economia e da Empresa (1º Ciclo) 2. Curso Gestão de Recursos Humanos 3. Ciclo de Estudos
Métodos Quantitativos
Métodos Quantitativos Unidade 2 Estatística descritiva 1 SUMÁRIO SEÇÃO SLIDES 2.1 Amostragem... 03 11 2.2 Tabelas e gráficos... 12 19 2.3 Medidas de posição... 20 24 2.4 Medidas de dispersão... 25 30 Observação:
ÍNDICE. Variáveis, Populações e Amostras. Estatística Descritiva PREFÁCIO 15 NOTA À 3ª EDIÇÃO 17 COMO USAR ESTE LIVRO? 21 CAPÍTULO 1 CAPÍTULO 2
COMO USAR ESTE LIVRO ÍNDICE PREFÁCIO 15 NOTA À 3ª EDIÇÃO 17 COMO USAR ESTE LIVRO? 21 CAPÍTULO 1 Variáveis, Populações e Amostras 1.1. VARIÁVEIS ESTATÍSTICAS E ESCALAS DE MEDIDA 27 1.2. POPULAÇÃO VS. AMOSTRA
Tutorial para o desenvolvimento das Oficinas
Tutorial para o desenvolvimento das Oficinas 1 Métodos Quantitativos Profa. Msc. Regina Albanese Pose 2 Objetivos Objetivo Geral Este tutorial tem como objetivo parametrizar o desenvolvimento da oficina
1 Introdução, 1 2 Polo Epistemológico, 9 3 Polo Teórico, 25
1 Introdução, 1 1.1 Tipos de Conhecimentos, 1 1.2 Classificação das Ciências, 2 1.3 Pesquisa nas Ciências Naturais e do Homem, 2 1.4 Epistemologia, 3 1.5 Um Modelo Paradigmático, 4 1.6 A Escolha de um
1 Introdução aos Métodos Estatísticos para Geografia 1
1 Introdução aos Métodos Estatísticos para Geografia 1 1.1 Introdução 1 1.2 O método científico 2 1.3 Abordagens exploratória e confirmatória na geografia 4 1.4 Probabilidade e estatística 4 1.4.1 Probabilidade
Especialização em Engenharia de Processos e de Sistemas de Produção
Especialização em Engenharia de Processos e de Sistemas de Produção Projetos de Experimento e Confiabilidade de Sistemas da Produção Prof. Claudio Luis C. Frankenberg 3ª parte Conforme foi apresentado
SUMÁRIO. 1.1 Introdução, Conceitos Fundamentais, 2
SUMÁRIO 1 CONCEITOS BÁSICOS, 1 1.1 Introdução, 1 1.2 Conceitos Fundamentais, 2 1.2.1 Objetivo, 2 1.2.2 População e amostra, 2 1.3 Processos estatísticos de abordagem, 2 1.4 Dados estatísticos, 3 1.5 Estatística
Universidade Federal de Mato Grosso - UFMT Probabilidade e Estatística
Universidade Federal de Mato Grosso - UFMT Probabilidade e Estatística 1 Introdução Definição: Estatística é um conjunto de conceitos e métodos científicos para coleta, organização, descrição, análise
Bioestatística. Paulo Nogueira quarta-feira, 11 de Janeiro de 2012
Bioestatística Paulo Nogueira quarta-feira, 11 de Janeiro de 2012 Bioestatística? Bioestatística Biologia + Estatística (Portmanteau) Biometria Estatística aplicada às ciências da saúde Para que serve
AULA 07 Inferência a Partir de Duas Amostras
1 AULA 07 Inferência a Partir de Duas Amostras Ernesto F. L. Amaral 10 de setembro de 2012 Faculdade de Filosofia e Ciências Humanas (FAFICH) Universidade Federal de Minas Gerais (UFMG) Fonte: Triola,
2. Estatística Descritiva
2. Estatística Descritiva ESTATÍSTICA Conjunto de técnicas e ferramentas que descreve, organiza, resume e interpreta as informações a partir dos dados coletados Estatística descritiva Conjunto de técnicas
Apontamentos de Introdução às Probabilidades e à Estatística
i Índice 1. Introdução 1 1.1. Enquadramento e objectivos 2 1.2. Organização 5 1.3. Noções base da Estatística 7 1.3.1. Distinção entre população e amostra 8 1.3.2. Amostragem 10 1.3.3. Unidade estatística
UNIVERSIDADE FEDERAL DA FRONTEIRA SUL Campus CERRO LARGO. PROJETO DE EXTENSÃO Software R: de dados utilizando um software livre.
UNIVERSIDADE FEDERAL DA FRONTEIRA SUL Campus CERRO LARGO PROJETO DE EXTENSÃO Software R: Capacitação em análise estatística de dados utilizando um software livre. Fonte: https://www.r-project.org/ Módulo
Análise Multivariada Aplicada à Contabilidade
Mestrado e Doutorado em Controladoria e Contabilidade Análise Multivariada Aplicada à Contabilidade Prof. Dr. Marcelo Botelho da Costa Moraes www.marcelobotelho.com mbotelho@usp.br Turma: 2º / 2016 1 Agenda
1. ANÁLISE EXPLORATÓRIA E ESTATÍSTICA DESCRITIVA
1. ANÁLISE EXPLORATÓRIA E ESTATÍSTICA DESCRITIVA 2019 Estatística Descritiva e Análise Exploratória Etapas iniciais. Utilizadas para descrever e resumir os dados. A disponibilidade de uma grande quantidade
ANÁLISE DOS RESÍDUOS. Na análise de regressão linear, assumimos que os erros E 1, E 2,, E n satisfazem os seguintes pressupostos:
ANÁLISE DOS RESÍDUOS Na análise de regressão linear, assumimos que os erros E 1, E 2,, E n satisfazem os seguintes pressupostos: seguem uma distribuição normal; têm média zero; têm variância σ 2 constante
3.1 - Medidas de Posição Medidas de Dispersão Quantis Empiricos Box-plots Graficos de simetria 3.
3 - MEDIDAS RESUMO 3.1 - Medidas de Posição 3.2 - Medidas de Dispersão 3.3 - Quantis Empiricos 3.4 - Box-plots 3.5 - Graficos de simetria 3.6 - Transformações 1/17 3.1 - Medidas de Posição Muitas vezes
ESTATÍSTICA ECONÔMICA A 6EMA
6EMA020-2000 Lucas Santana da Cunha email: lscunha@uel.br Universidade Estadual de Londrina 13 de abril de 2016 CRONOGRAMA 1 o BIMESTRE: MÓDULO I - Estatística Descritiva Noções Básicas em estatística:
Elementos de Estatística
Elementos de Estatística Lupércio F. Bessegato & Marcel T. Vieira UFJF Departamento de Estatística 2013 Medidas Resumo Medidas Resumo Medidas que sintetizam informações contidas nas variáveis em um único
MAIS SOBRE MEDIDAS RESUMO. * é muito influenciada por valor atípico
MAIS SOBRE MEDIDAS RESUMO Medidas de Tendência Central (1) média (aritmética) * só para variáveis quantitativas exceção: variável qualitativa nominal dicotômica, com categorias codificadas em 0 e 1; neste
UNIVERSIDADE LUSÍADA DE LISBOA. Programa da Unidade Curricular ANÁLISE DE DADOS Ano Lectivo 2017/2018
UNIVERSIDADE LUSÍADA DE LISBOA Programa da Unidade Curricular ANÁLISE DE DADOS Ano Lectivo 2017/2018 1. Unidade Orgânica Ciências da Economia e da Empresa (1º Ciclo) 2. Curso Economia 3. Ciclo de Estudos
Professora conteudista: Maria Ester Domingues de Oliveira. Revisor: Francisco Roberto Crisóstomo
Estatística Básica Professora conteudista: Maria Ester Domingues de Oliveira Revisor: Francisco Roberto Crisóstomo Sumário Estatística Básica Unidade I 1 CICLO SEMPRE CRESCENTE...2 2 ESTATÍSTICA: CIÊNCIA
Mais Informações sobre Itens do Relatório
Mais Informações sobre Itens do Relatório Amostra Tabela contendo os valores amostrados a serem utilizados pelo método comparativo (estatística descritiva ou inferencial) Modelos Pesquisados Tabela contendo
Análise da Regressão. Prof. Dr. Alberto Franke (48)
Análise da Regressão Prof. Dr. Alberto Franke (48) 91471041 O que é Análise da Regressão? Análise da regressão é uma metodologia estatística que utiliza a relação entre duas ou mais variáveis quantitativas
UNIVERSIDADE LUSÍADA DE LISBOA. Programa da Unidade Curricular ESTATÍSTICA Ano Lectivo 2013/2014
Programa da Unidade Curricular ESTATÍSTICA Ano Lectivo 2013/2014 1. Unidade Orgânica Ciências da Economia e da Empresa (1º Ciclo) 2. Curso Contabilidade 3. Ciclo de Estudos 1º 4. Unidade Curricular ESTATÍSTICA
UNIVERSIDADE LUSÍADA DE LISBOA. Programa da Unidade Curricular ANÁLISE DE DADOS Ano Lectivo 2017/2018
Programa da Unidade Curricular ANÁLISE DE DADOS Ano Lectivo 2017/2018 1. Unidade Orgânica Ciências da Economia e da Empresa (1º Ciclo) 2. Curso Gestão de Empresa 3. Ciclo de Estudos 1º 4. Unidade Curricular
Processos Hidrológicos CST 318 / SER 456. Tema 9 -Métodos estatísticos aplicados à hidrologia ANO 2016
Processos Hidrológicos CST 318 / SER 456 Tema 9 -Métodos estatísticos aplicados à hidrologia ANO 2016 Camilo Daleles Rennó Laura De Simone Borma http://www.dpi.inpe.br/~camilo/prochidr/ Caracterização
Princípios em Planejamento e Análise de Dados Ecológicos. Regressão linear. Camila de Toledo Castanho
Princípios em Planejamento e Análise de Dados Ecológicos Regressão linear Camila de Toledo Castanho 217 Conteúdo da aula 1. Regressão linear simples: quando usar 2. A reta de regressão linear 3. Teste
Renda x Vulnerabilidade Ambiental
Renda x Vulnerabilidade Ambiental ANEXO D ANÁLISE EXPLORATÓRIA E PREPARAÇÃO DOS DADOS Identificamos tendência linear positiva. A correlação entre as variáveis é significativa, apresentando 99% de confiança.
4. ANÁLISE DOS RESULTADOS DA PESQUISA
68 4. ANÁLISE DOS RESULTADOS DA PESQUISA Conforme já comentado, este estudo visa analisar a relação entre o EVA e o retorno das ações no mercado acionário brasileiro, através da aplicação de dois modelos
* Descrição: organização, resumo, apresentação e interpretação de dados (tabelas, gráficos e sumários estatísticos, de posição e de dispersão)
ESTATÍSTICA DESCRITIVA a) Conceito: Apresentação numérica, tabular e/ou gráfica com o propósito resumir ou sumarizar as informações contidas num conjunto de dados observados (estatística: tabelas, gráficos
Estatística Básica. Profa. Andreza Palma
Estatística Básica Profa. Andreza Palma DEFINIÇÕES PRELIMINARES Estatística (ciência): A ciência de coletar, organizar, apresentar, analisar e interpretar dados numéricos com o objetivo de tomar melhores
PARTE 1. Profa. Dra. Alessandra de Ávila Montini
PARTE 1 Programa de Pós-graduação do Departamento de Administração PPGA Agenda 2 14:00 15:30 Fundamentação Teórica 15:30 15:45 Coffee break 15:45 17:00 Fundamentação Teórica 17:00 18:00 Exercícios de Fixação
Pressuposições à ANOVA
UNIVERSIDADE FEDERAL DE RONDÔNIA CAMPUS DE JI-PARANÁ DEPARTAMENTO DE ENGENHARIA AMBIENTAL Estatística II Aula do dia 09.11.010 A análise de variância de um experimento inteiramente ao acaso exige que sejam
VERIFICAÇÃO DA ADEQUAÇÃO DO MODELO DE ANÁLISE DE VARIÂNCIA ANÁLISE DE RESÍDUOS
VERIFICAÇÃO DA ADEQUAÇÃO DO MODELO DE ANÁLISE DE VARIÂNCIA ANÁLISE DE RESÍDUOS Conforme foi apresentado anteriormente, o modelo de análise de variância assume que as observações são independentes e normalmente
P R O G R A M A TERCEIRA FASE. DISCIPLINA: Estatística Aplicada à Pesquisa Educacional Código: 3EAPE Carga Horária: 54h/a (crédito 03)
UNIVERSIDADE DO ESTADO DE SANTA CATARINA - UDESC CENTRO DE CIÊNCIAS DA SAÚDE E DO ESPORTE - CEFID DEPARTAMENTO DE EDUCAÇÃO FÍSICA - DEF CURSO: LICENCIATURA EM EDUCAÇÃO FÍSICA CURRÍCULO: 2008/2 P R O G
Mario de Andrade Lira Junior lira.pro.br\wordpress
Mario de Andrade Lira Junior lira.pro.br\wordpress lira.pro.br\wordpress autorais. 27/04/2009 1 Modelo simplificação da realidade Linear formato de reta Generalizado não específico Cada delineamento experimental
Por que testes não-paramétricos?
Universidade Federal de Minas Gerais Instituto de Ciências Exatas Departamento de Estatística Métodos Estatísticos Avançados em Epidemiologia Aula 3 Testes Não-Paramétricos: Wilcoxon Mann-Whitney Kruskal-Wallis
Prof. Dr. Engenharia Ambiental, UNESP
INTRODUÇÃO A ESTATÍSTICA ESPACIAL Análise Exploratória dos Dados Estatística Descritiva Univariada Roberto Wagner Lourenço Roberto Wagner Lourenço Prof. Dr. Engenharia Ambiental, UNESP Estrutura da Apresentação
A qualidade das inferências feitas por estes. de normalidade se fazem necessários.
Verificação da Suposição de Normalidade A maior parte das técnicas estudadas de Inferência Estatística partem do pressuposto de normalidade dos dados: teste t para uma a- mostra, teste t pareado, teste
UNIVERSIDADE LUSÍADA DE LISBOA. Programa da Unidade Curricular ANÁLISE DE DADOS Ano Lectivo 2013/2014
Programa da Unidade Curricular ANÁLISE DE DADOS Ano Lectivo 2013/2014 1. Unidade Orgânica Ciências da Economia e da Empresa (1º Ciclo) 2. Curso Economia 3. Ciclo de Estudos 1º 4. Unidade Curricular ANÁLISE
Métodos Estatísticos Avançados em Epidemiologia
1 / 44 Métodos Estatísticos Avançados em Epidemiologia Análise de Variância - ANOVA Referência: Cap. 12 - Pagano e Gauvreau (2004) - p.254 Enrico A. Colosimo/UFMG Depto. Estatística - ICEx - UFMG 2 / 44
Estatística para Cursos de Engenharia e Informática
Estatística para Cursos de Engenharia e Informática Pedro Alberto Barbetta / Marcelo Menezes Reis / Antonio Cezar Bornia São Paulo: Atlas, 2004 Cap. 3 Análise exploratória de dados APOIO: Fundação de Apoio
Conceito de Estatística
Conceito de Estatística Estatística Técnicas destinadas ao estudo quantitativo de fenômenos coletivos, observáveis. Unidade Estatística um fenômeno individual é uma unidade no conjunto que irá constituir