Pensar estatisticamente será um dia, para a eficiente prática da cidadania, tão necessário como a habilidade de ler e escrever.

Tamanho: px
Começar a partir da página:

Download "Pensar estatisticamente será um dia, para a eficiente prática da cidadania, tão necessário como a habilidade de ler e escrever."

Transcrição

1 Pensar estatisticamente será um dia, para a eficiente prática da cidadania, tão necessário como a habilidade de ler e escrever. H. G. Wells (Escritor, considerado o pai da moderna Ficção Científica, 1895) 1

2 Motivação das empresas para estudo e uso de Estatística: Entrada Foco no Processo: Um dos principais requisitos da ISO 9001:000 Fatores Controláveis... x1 x xp Processo... Saída y1 y ym z1 z zq Fatores Incontroláveis (ruído)

3 Y=f(X)+Z Exemplo de Processo X Pressão de ar air strip Pressão de ar air bag Pressão de ar front piston Pressão Hidráulica Temperatura Aplicação: Pense Vazão de óleo Solúvel em um problema Pressão do Nitrogênio similar em sua Y área de atuação Espessura da parede Top Wall Espessura da Parede Mid Wall Profundidade do Dome Altura da Lata Visualização Processo Bodymaker de fabricação de latas Z Operador Rede Elétrica Qualidade da Bobina É complexo inferir sobre X,Y e Z sem Estatística! 3

4 Cone of Learning DO THE REAL THING! Faça anotações! Aplicando os conhecimentos na sua área é a única forma de sedimentá-los! 4

5 Recursos de Software O uso de recursos computacionais tornou os cálculos atividades fáceis permitindo uma maior ênfase na compreensão e interpretação dos resultados Statgame e Statquiz (Interessante para verificar o conhecimento básico) 5

6 Pratique: Gere a planilha ao lado e entenda a diferença entre Worksheet e Project. Observe o que é Session.. Calcule as principais Estatísticas Descritivas da planilha gerada. Siga o caminho: <Stat> <Basic Statistics> <Graphical Summary> 3. Navegue no Statguide 4. Navegue pelo Tutorial do Minitab 5. Observe os ícones para Worksheet, Session, Show Graphs Folder e Edit Last Dialog 6

7 6. Gere uma série de 100 valores aleatórios que poderia simular uma variabilidade em Temperatura; Use <Calc> <Random Data> <Normal Distribution> e inclua os parâmetros convenientes (Ex.: Média=100, S=10). 7. Calcule as principais estatísticas descritivas da planilha usando Graphical Summary. Faça outros gráficos. 8. Entenda o procedimento <Calc> <Set Base>? 9. Salve a planilha na Desktop com um nome qualquer. 10. Feche o programa minitab e depois abra a planilha que você salvou. 7

8 Um bom Material de Apoio Obtenha domínio sobre o Minitab a partir do arquivo minitab.pdf. 8

9 Uma ótima bibliografia: Montgomery, D.C., Runger, G.C., Estatística Aplicada e Probabilidade para Engenheiros, ª ed., LTC Livros Técnicos e Científicos, 00, 461 p. Não deixe de ler: Fora de Série (Outliers) Malcolm Gladwell Editora Sextante Descubra por que algumas pessoas tem sucesso e outras não Uma Senhora Toma Chá David Salsburg Editora Zahar Como a estatística revolucionou a ciência no século XX 9

10 SUMÁRIO 1 Estatística Descritiva Distribuições de Probabilidade 3 Estimação e Intervalos de Confiança 4 Testes de Hipótese 5 Análise de Variância 6 Correlação e Regressão 7 Testes de Independência 10

11 1 - Estatística Descritiva Deus não joga dados com o universo (Albert Einstein) Os experimentos geralmente não são determinísticos (Fisher) 11

12 Do que trata a Estatística A essência da ciência é a observação. Estatística: A ciência que se preocupa com a organização, descrição, análise e interpretação dos dados experimentais. Ramo da Matemática Aplicada. A palavra estatística provêm de Status. Estatística Básica (Anova, TH, Regressão) Séries Temporais Data Mining Six Sigma Redes Neurais Controle de Qualidade Estatística Bayseana Simulação / PO DOE /Taguchi /RSM Análise do Sistema de Medição Estatística Multivariada Amostragem / Pesquisa Confiabilidade Caos Em 166, John Graunt publicou os primeiros informes estatísticos. Era sobre nascimento e mortes. 1

13 População e Amostra A População (ou Distribuição) é a coleção de todas as observações potenciais sobre determinado fenômeno. O conjunto de dados efetivamente observados, ou extraídos, constitui uma Amostra da população. Um Censo é uma coleção de dados relativos a Todos os elementos de uma população. Um Parâmetro está para a População assim como uma Estatística está para a Amostra. 13

14 Tipos de Dados (Também Dados Categóricos ou de Atributos) Nominal Qualitativa Ordinal Variável Discreta Quantitativa Contínua (Variáveis) Ex.: Para uma população de peças produzidas em um determinado processo, poderíamos ter: Variável Tipo Estado: Perfeita ou defeituosa Qualitativa Nominal Qualidade: 1 a, a ou 3 a categoria Qualitativa Ordinal N o de peças defeituosas Quantitativa Discreta Diâmetro das peças Quantitativa Contínua 14

15 <Calc> <Random Data> Números Aleatórios Aplicação: Gere sequências de valores aleatórios que represente problemas em sua área. O que significa o procedimento <Calc> <Set Base>? Amostragem: Gere a sequência <Calc> <Make Patterned Data> Selecione uma amostra com 10 valores a partir das sequências geradas anteriormente. Use <Calc> Random Data> <Sample from Column> 15

16 <Graphical Summary> Aplicação: Gere uma sequência de dados que represente um processo em sua área e calcule as estatísticas desse conjunto de dados. Use: <Random> e <Graphical Summary> Ex.:Número de acessos à página do Site da Empresa durante os últimos 100 dias úteis. 16

17 Medidas de Posição: Média Aritmética Simples Aritmética Ponderada x = x x + x L+ x 1 n i 1 x p + n x p n = = L+ x n x i 1 1 n n i= 1 = = n p1 + p + L+ pn p n i= 1 x i p p i i Um pouco sobre arredondamento de médias: Tome uma decimal acima da dos dados: Ex.:,4 3,4 e 5,7 => média =3,73 Em várias operações, arredonde apenas o resultado final 17

18 Um Cidadão Americano Médio Chama-se Robert Pesa 78 Kg Manequim cm de cintura Consome anualmente 8,5 Kg massa, 11,8Kg de bananas, 1,8 Kg de batatas fritas, 8,15Kg de sorvete e 35,8 Kg de carne. Vê TV por ano 567 horas Recebe anualmente 585 coisas por correio (cartas e outros) Diariamente dorme 7,7 horas, gasta 1 minutos para chegar ao trabalho e trabalha 6,1 horas 18

19 Medidas de Posição: Mediana ~x Se n é ímpar: = n + 1 o termo ~ x = Se n épar: n n o + termo + 1 o termo Ex.: { } 35, 36, 37, 38, 40, 40, 41, 43, 46 x~ = ,,,,,,, ~ + x = = 15, 5 { } Mediana é o valor do meio de um conjunto de dados dispostos em ordem crescente ou decrescente. Inconveniente: Não considera todos os valores da amostra! 19

20 Média x Mediana Ex.: { 00, 50, 50, 300, 450, 460, 510 } x = 345, 7 ~x = 300 Ambas são boas medidas de Tendência Central. Prefira a média { 00, 50, 50, 300, 450, 460, 300 } x = 601 ~x = 300 Devido ao Outlier 300, a mediana é melhor estatística que a média. 0

21 Medidas de Dispersão Rode e Entenda o programa Interativo da PQ Systems Discuta: 1) Porque os bancos adotam fila única? ) Por favor, com quantos dias de antecedência eu devo postar uma carta de aniversário para minha mãe? 1

22 Variabilidade A = { 3, 4, 5, 6, 7 } B = { 1, 3, 5, 7, 9 } C = { 5, 5, 5, 5 } D = { 3, 5, 5, 7 } E = { 3.5, 5, 6.5 } Uma medida de Posição não é suficiente para descrever um conjunto de dados. Os Conjuntos ao lado mostram isso! Eles possuem mesma média, sendo diferentes. Algumas medidas de Variabilidade: Amplitude (H): Tem o inconveniente de levar em conta apenas os dois valores extremos: H Á =7-3=4 Amplitude=Range

23 Medidas de Dispersão Considerando os desvios em relação à média, temos, para A, por exemplo: A = { 3, 4, 5, 6, 7 } xi - x {-, -1, 0, 1, } Inconveniente: n i= 1 ( x i n x) = x i n i= 1 i= 1 x = nx nx 0 Uma opção para analisar os desvios das observações é: considerar o total dos quadrados dos desvios. 5 i = 1 ( x x) i = = 10 3

24 Desvio Padrão Associando ao número de elementos da amostra (n), tem-se: S = n i = 1 ( x x) i n....que é a Variância ( Var(x)) S = S...que é o Desvio Padrão (DP(x)), uma medida que é expressa na mesma unidade dos dados originais 4

25 Dispersão: Fórmulas Alternativas σ = n i= 1 ( x x) i n = n i= 1 n x i x S = n i = 1 ( x x) n i 1 Variância Populacional (σ ou σ n ) Variância Amostral n-1 está Relacionado a um problema de tendenciosidade 5

26 Exemplo X X = X Calcular a Variância e o Desvio Padrão de X Média Média = 3 Soma dos pontos de dados Número dos pontos de dados ( X X) ( X X) Uma Regra Prática para conjunto de dados típicos: S=Amplitude/4 S= S Raiz Raiz Qadrada da da Variância = Desv.Pa. = S = 1,58 1,58 S Divide Divide a Soma Soma por por (n-1): (n-1): = Variância = S =,5,5 Soma Soma da da última última coluna coluna =

27 Expressões para Média e Variância Média da População Desvio Padrão da População Média da Amostra Desvio Padrão da Amostra σ = µ = s= N X N i=1 N i= 1 (X µ ) i x= N N i=1 i n i=1 n x i (X X ) i N-1 7

28 Outra Estratégia: Percentis e Boxplot * Outlier ( fora da distância do Q3 + 1,5D ) Observação Máxima Q3=75ª Percentil D=Q3-Q1 Interquartil Q=Mediana (50ª Percentil) Q1=5ª Percentil DBP EDA (Exploratory Data Analysis) e Método dos Cinco Números 75% 50% 5% Boxplot é desgastante quando feito sem computador pois supõe a ordenação de dados. 8

29 Percentis e Boxplot graficos.mtw Valor do meio 3.(n+1)/4 0.(n+1)/4 0 (n+1)/4 0 Quartis: Q1=Quarta Observação Crescente=71.7 Q3=Quarta Observação Decrescente=150.6 Outliers: Q3+1.5D= ( )=68.95 São outliers valores maiores que Para valores não inteiros dos quartis, usa-se interpolação 9

30 Escores padronizados (z) z i = x i s x x i - x considera o afastamento de x i em relação à média. A divisão por s torna s como unidade ou padrão de medida. Ex.: Dois grupos de pessoas acusam os seguintes dados: Nesses grupos há duas pessoas que pesam respectivamente, 81. kg e 88.0 kg. 81, 66,5 88 7,9 em A: z A = =,3 e em B : z B = = 1, 95 6,38 7,75 Grupo Peso médio Desvio Padrão A 66.5 kg 6.38 kg B 7.9 kg 7.75 kg Logo, a pessoa de A revela um maior excesso relativo de peso. 30

31 Distribuição Normal ϕ(z) z = x µ σ X : N( µ ; σ ) Z: N(0; 1) Tal fórmula está tabelada e fornece valores acumulados Distribuião Normal Reduzida ou Padronizada z Qual o formato da curva acumulada? µ-3σ µ -σ µ -σ µ µ+σ µ+σ µ+3σ x N(0,1) é a distribuição Benchmark 31

32 Escores padronizados (z) Uma mulher deu à luz um filho 308 dias após a visita de seu marido que serve na marinha dos EUA. Sabendo-se que uma gravidez normal tem média de 68 dias e desvio-padrão de 15 dias, determine se o tempo de gravidez da mulher pode ser considerado comum. O marido tem razão de se preocupar? z i = x i s x 3

33 Regra Regra Escores padronizados (z) z i = x i x s Cerca de 68% dos valores estão a menos de 1 desvio padrão a contar da média (-1 < z < 1) Cerca de 95% dos valores estão a menos de desvios padrão a contar da média (- < z < ) Cerca de 99% dos valores estão a menos de 3 desvios padrão a contar da média (-3 < z < 3) 33

34 Skewness and Kurtosis Assimetria (Skewness) Próximo de 0: Simétrico Menor que 0: Assimétrico à Esquerda Maior que 0: Assimétrico à Direita Achatamento (Kurtosis) Próximo de 0: Pico Normal Menor que 0: Mais achatada que o Normal (Uniforme) Maior que 0: Menos achatada que o normal (Afinada) 34

35 Assimetria, Percentis e Boxplot 35

36 Exercício Encontre todas as estatísticas descritivas para a série da tabela a seguir

37 Distribuição de Freqüências X Ex.: População = X=Diâmetro de determinada peça (em mm). Dados brutos: { 168, 164, 164, 163, 165, 168, 165, 164, 168, 168 } Rol: { 163, 164, 164, 164, 165, 165, 168, 168, 168, 168 } Amplitude (H) = = 5 n i (Frequência Absoluta) f i (Frequência Relativa) N i (Frequência Absoluta Acumulada) F i Frequência Relativa Acumulada) Σ 10 1 K n = 1 f i K i= 1 i = f i ni n n = 1 F i = N n i 37

38 Classes (ou Categorias) DISTRIBUIÇÃO DE FREQUÊNCIAS x (Variável) x i (ponto médio) n i (frequência absoluta) f i (frequência relativa) f% (frequência percentual) N i (Absoluta Acum.) F i (Relativa Acum.) F% (Percentual Acum.) Σ

39 Classes (ou Categorias) EXEMPLO MÉDIA P/DADOS AGRUPADOS x (Variável) x i (ponto médio) n i (frequência absoluta) (Xi).(ni) Σ Média X = = X = = n i= 1 n i= 1 36,4 x. n i n i i 39

40 Histogramas n i Construção da tabela de distribuição de freqüências a partir do histograma de classes desiguais. Exercício: Complete a tabela X n i f i x Σ 1 40

41 Soma de Normais Processo A Processo B Tempo Total (A+B)? X = 3 = 7 s = 1 s = 3 7 X S A+ B = S A 1+ = 3 + S B = (1) + ().3 Incorreto; = 5 = Correto; Some as variâncias e depois obtenha o Desvio Padrão 41

42 Diferença de Normais Linha A Diferença: Linha A Linha B Linha B? XA B = XA - XB = 3-7 = - 4 X = 3 X = 7 s = 1 s = S A B = S A + S B = (1) + () = 5 =.3 Correto 1 = 1 Incorreto 4

43 graficos.mtw Representação Gráfica:Ramo-e-folhas x Ramos x x Folhas x x x x x x x x Ex.:

44 Ramo-e-folhas Obtendo o seguinte Folha e Ramo. Compare os resultados fazendo um Histograma. O que representa tal coluna? Stem-and-Leaf Display: folha_ramo Stem-and-leaf of Ramo N = 33 Leaf Unit = (10) Coluna folha_ramo 44

45 Plot Exercício no Minitab: Faça o gráfico abaixo a partir dos dados seguintes. 45

46 <Marginal Plot> Faça o gráfico bidimensional a partir dos dados a seguir graficos.mtw 46

47 Runchart <Stat> <Quality Tools> <Run Chart> Column=Tempo na fila Subgroup Size=1 runchart.mtw Os dados representam uma série temporal Tal gráfico é útil para ver a estabilidade de um processo. Control Chart é Melhor! 47

48 Multi-Vari Identifica Diversos tipos de variação A análise de efeitos é similar em DOE Sinter.mtw Permite identificar interações Não é o mesmo que Estatística Multivariada Use os Dados a seguir <Stat> <Quality Tools> <Multi-Vari>: Response: Força (y) Factor1: TempoSinter (x1) Factor: TipoMetal (x) Força 3,5,5 1,5 0,5 19,5 18,5 17, TipoMetal TempoSinter 0,5 1,0,0 48

49 Multi-Vari Monte a Tabela Nível 0,5 Nível 1,0 Nível,0 x1 x y x1 x y x1 x y 0, , , , , , , , ,

50 - DISTRIBUIÇÕES DE PROBABILIDADE 50

51 Sumário 1 - Motivação - Distribuições de Probabilidade Distribuições Contínuas Distribuição Discretas 51

52 Motivação O reconhecimento da importância dos processos estocásticos; A consideração da Incerteza associada aos eventos; Exatidão na modelagem matemática; Correta determinação da probabilidade de ocorrência dos fenômenos; A otimização de processos industriais e de serviços através de técnicas de SIMULAÇÃO. 5

53 DISTRIBUIÇÕES DE PROBABILIDADE 53

54 Formatos de Distribuições 54

55 Distribuições Contínuas de Probabilidade Área da curva é unitária Probabilidade está associada a área P f ( x) 0 f b ( x) = 1 ( a X b) = f ( x) dx ( b > a f(x) => fdp Função densidade de probabilidade a) Algumas Distribuições Contínuas: Normal Uniforme Chi-square Fisher(F) Student(t) Beta Cauchy Exponential Gamma Laplace Logistic Lognormal Weibull 55

56 Distribuição Normal a) f ( x) dx = 1 f(x) b) f(x) 0 c) lim f ( x) = 0 e lim f ( x) = 0 x x d) f(µ + x) = f(µ - x) f ( x) = 1 e σ π µ µ+σ ( 1 ) x µ σ x e) Máx f(x) ocorre em x = µ f) Os pontos de inflexão são x = µ ± σ g) E (X ) = µ h) Var(X ) = σ 56

57 Distribuição Normal Pouca Utilidade Prática Retorna a probabilidade Acumulada Retorna a Variável quando é dada a probabilidade acumulada Exemplo X:N(100,5) P(X<=95)=0,

58 Distribuição Normal X : N( µ ; σ ) µµ Se a dimensão de uma peça segue uma distribuição Normal X: N(80,3) qual a Probabiliade de ter uma peça defeituosa de acordo com a figura? 1σ 1σ p(d) TT 3σ LSE Used With Permission 6 Sigma Academy Inc

59 Distribuição Normal Exercício 1: Em uma população onde as medidas tem Média 100 e Desvio Padrão 5, determine a probabilidade de se ter uma medida: a) Entre 100 e 115 Dica: b) Entre 100 e 90 c) Superior a 110 d) Inferior a 95 e) Inferior a 105 f) Superior a 97 g) Entre 105 e 11 h) Entre 89 e 93 i) 98 Crie uma coluna com os valores no Minitab Crie uma coluna com os valores 0,74...0,05 no Minitab Use: <Calc><Probability Distribution><Normal> Exercício : Em uma população onde as medidas tem Média 100 e Desvio Padrão 5, determine os valores k tais que se tenha a probabilidade: a) P(X>k)=0,6 b) P(X<k)=0,3 c) P(100-k<100<100+k)=0,47 d) P(x<100-k)+P(x>100+k)=5% 59

60 Probabilidades e Escores padronizados (z) Exemplo Um cliente tem um portfólio de investimentos cuja média é US$ com desvio padrão de US$ Determine a probabilidade de que o valor de seu portfólio esteja entre US$ e US$ z i x = i µ σ 60

61 Probabilidades e Escores padronizados (z) Exemplo Se X tem distribuição normal N(15, 4), encontre a probabilidade de X ser maior que 18. Exemplo Uma companhia produz lâmpadas cuja vida segue uma distribuição normal com média 1.00 horas e desvio padrão de 50 horas. Escolhendo-se aleatoriamente uma lâmpada, qual é a probabilidade de sua durabilidade estar entre 900 e horas? 61

62 Probabilidades e Escores padronizados (z) Exemplo Um grupo de estudantes obtém notas que são normalmente distribuídas com média 60 e desvio padrão 15. Que proporção dos estudantes obtiveram notas entre 85 e 95? Exemplo No caso da prova do exercício anterior, determine a nota acima da qual estão 10% dos melhores alunos da classe. 6

63 Probabilidades e Escores padronizados (z) Exercício É sabido que a quantidade anual de dinheiro gasto em livros por alunos de uma universidade, segue uma distribuição normal com média $380 e desvio padrão de $50. Qual é a probabilidade de que um aluno escolhido aleatoriamente no campus gaste mais do que $ 360 por ano? 63

64 Probabilidades e Produção Exercício A demanda antecipada de consumo de um certo produto é representada por uma distribuição normal com média 1.00 unidades e desvio padrão de 100. a) Qual é a probabilidade de que as vendas excedam unidades? b) Qual é a probabilidade de que as vendas estejam entre e 1300 unidades? c) A probabilidade de se vender mais do que k unidades é de 10%. Determine k. 64

65 Probabilidades e Investimentos Exercício Um portfólio de investimentos contém ações de um grande número de empresas. Ao longo do último ano as taxas de retorno das ações dessas corporações seguiram distribuição normal com média de 1,% e desvio padrão de 7,%. a) Para que proporção de empresas o retorno foi maior que 0%? b) Para que proporção de empresas o retorno foi negativo? c) Que proporção de empresas tiveram retornos entre 5% e 15%? 65

66 Probabilidades e Investimentos Exercício Considere dois investimentos. Em ambos, a taxa de retorno segue uma distribuição normal, com média e desvio padrão conhecidos conforme tabela a seguir. Deseja saber qual dos investimentos é mais provável de produzir retornos de no mínimo 10%. Que investimento deveria ser escolhido? Média Desvio Investimento A 10,4 1, Investimento B 11,0 4,0 66

67 Probabilidades e Finanças Exercício Um portifólio de investimentos contém ações de um grande número de empresas. Ao longo do último ano as taxas de retorno das ações dessas corporações seguiram distribuição normal com média de 1,% e desvio padrão de 7,%. a) Para que proporção de empresas o retorno foi maior que 0%? b) Para que proporção de empresas o retorno foi negativo? c) Que proporção de empresas tiveram retornos entre 5% e 15%? 67

68 Distribuição Uniforme + ( X ) = µ = E xf ( x) dx σ + ( X ) = ( x µ ) = Var f ( x) dx A = 1 F(x) a b A = b. h f ( x) = = ( b a) f ( b ( x) 1 a) = 1 ( X ) b µ = E = a 1 a + x dx = b b a + ( b ) a + b 1 a σ = Var( X ) = ( x µ ) f ( x) dx = x dx = b a

69 Distribuição Exponencial Função Exponencial 0 0,06 0,05 f ( ) xi x = λ. e λ 0,04 F(x) 0,03 0,0 0,01 0, x σ ( X ) µ = E = xλe λx ( X ) = ( x µ ) f ( x) dx = x λe dx = = Var dx = λx 1 λ 0 λ λ 69

70 Distribuição Weibull Weibull 0 1,0 0,8 Variable C7 * Weibull 1 1 C8 * Weibull 3,4 C9 * Weibull 4,5 6. f ( x) = β x δ δ β 1 e x δ β Y-Data 0,6 0,4 0, 0, X-Data

71 Distribuição Uniforme Exemplo A espessura de um componente é uma variável aleatória uniformemente distribuída entre os valores 0,95 a 1,05 cm. a) Determine a proporção de componentes que excedem a espessura de 1,0 cm. b) Qual é o valor de espessura que é excedida por 90% dos componentes? c) Qual é o valor da espessura abaixo da qual estão 75% dos componentes? 71

72 Distribuição Uniforme Exemplo Suponha que uma variável aleatória seja uniformemente distribuída no intervalo [1.5; 5.5]. a) Determine a probabilidade de x ser menor que,5. b) Qual é a probabilidade de x ser maior que 3,5? c) Determine o valor de k, de modo que a probabilidade de x ser maior que k seja de 40% 7

73 Distribuição Exponencial Exemplo Considere o seguinte conjunto de dados: [6,, 1, 19, 8, 4]. Ajustando estes dados por distribuição exponencial, determine: a) A probabilidade de uma v.a. x ser menor que 10. b) A probabilidade de uma v.a. x ser menor que 5. c) P(5< x < 10). 73

74 Distribuição Exponencial Exemplo Suponha que X tem uma distribuição exponencial com média igual a 10. Determine: a) A probabilidade de uma v.a. x ser maior que 10. b) A probabilidade de uma v.a. x ser menor que 0. c) Encontre k tal que P(X<k)=0,95 74

75 Distribuição Exponencial Exemplo O tempo entre as chamadas telefônicas para uma loja de suprimentos é distribuído exponencialmente com um tempo médio de 15 minutos entre as chamadas. Determine: a) A probabilidade de não haver chamadas por um período de 30 minutos. b) A probabilidade de que no mínimo uma chamada chegue dentro do intervalo de 10 minutos. c) A probabilidade de que a primeira chamada chegue entre 5 e 10 minutos. d) O intervalo de tempo, tal que exista uma probabilidade de 90% de haver no mínimo uma chamada no intervalo. 75

76 Distribuição Exponencial Exemplo O tempo entre as chegadas de ônibus a uma estação rodoviária é distribuído exponencialmente, com média 10 min. Determine: a) x, tal que a probabilidade de vc esperar mais de x minutos seja de 10%. b) x, tal que a probabilidade de vc esperar menos de x minutos seja de 90%. c) x, tal que a probabilidade de vc esperar menos de x minutos seja de 50%. 76

77 Distribuição Exponencial Exemplo O tempo entre a chegada de s em seu computador é distribuído exponencialmente com média igual a duas horas. Determine: a) Qual a probabilidade de vc não receber uma mensagem durante o período de duas horas? b) Se vc não tiver recebido uma mensagem na últimas quatro horas, qual será a probabilidade de vc não receber mensagens nas próximas duas horas? 77

78 Distribuição Exponencial Exemplo O tempo entre as chamadas para o escritório do CEO de uma corporação é exponencialmente distribuído com média igual a 10 minutos. Determine: a) Qual a probabilidade de não haver chamadas dentro de meia hora? b) Se a secretária do CEO se ausentar por 5 minutos, qual será probabilidade dela não atender (e repassar) uma importante ligação para o chefe? 78

79 Distribuição Discretas de Probabilidade Algumas Distribuições Discretas A Distribuição Binomial A Distribuição de Poisson A Distribuição Geométrica A Distribuição de Pascal A Distribuição Multinomial A Distribuição Hipergeométrica A soma das frequências é unitária n i= 1 f f ( x ) i 0 ( ) = 1 x i ( X = x ) f ( ) P = A probabilidade é a frequência i x i 79

80 Distribuição Binomial Use o programa Statdisk <Analysis> <Probability Distribution> <Binomial Distribution> Observe em <Options> os valores acumulados 80

81 Distribuição Binomial P ( X = x) = = x! 0 n! x p (1! para outros ( n x) p) n x valores x = 01,,,... n E(X) = np e Var (X) = npq Ex.: A probabilidade de um teste Burn in / Burn out queimar um componente eletrônico é 0, (p). Colocando-se três (n) componentes sob teste, qual a probabilidade de que pelo menos dois deles (x) se queime? 81

82 Distribuição Binomial E = {QQQ, QQN, QNQ, NQQ, NNQ, NQN, QNN, NNN} onde Q e N representam a queima ou não do componente x P(x) P{NNN} = P(X = 0) = q 3 = (0.8) 3 X: Número de Queimas Q P{NNQ} + P{NQN} + P{QNN} = P(X = 1) = 3pq = 3(0.)(0.8) P{QQN} + P{QNQ} + P{NQQ} = P(X = ) = 3p q = 3(0.) (0.8) P{QQQ} = P(X = 3) = p 3 = (0.) 3 P(X ) = P(X=) + P(X= 3) = 3p q + p 3 = = 10,4% 8

83 Distribuição Binomial Exercício: Suponha que uma válvula eletrônica, instalada em determinado circuito, tenha probabilidade 0. de funcionar durante o tempo de garantia. São ensaiadas 0 válvulas. a) Qual a probabilidade de que delas, exatamente k, funcionem durante o tempo de garantia (k = 0, 1,,... 0)? b) Qual a probabilidade de que 4 funcionem durante o tempo de garantia? c) Qual o número médio e o desvio padrão de válvulas que irão funcionar durante o tempo de garantia? X Número de válvulas que funcionam durante o tempo de garantia. p = 0. X = 0, 1,,

84 Distribuição Binomial P(X = x) P ( X = x) = = n x n x p (1 p) x 0 para outros x = 01,,, Ln valores E(X) = np e Var (X) = npq com média E(x) = np = 0.(0.) = 4 e desvio padrão npq = P( X = k) 0 = k 0 ( ) k ( ) k x 84

85 Distribuição Binomial Exercício: Complete a tabela referente a Distribuição Binomial a seguir: n p k P(X=k) F(k) P(X>k) P(X<k) E(x) 4 0, 8 0, , , ,

86 Distribuição Binomial n p k P(X=k) F(k) P(X>k) P(X<k) E(x) 4 0, 0,1536 0,1536 0,07 0,819 0,8 8 0,5 4 0,734 0,734 0,3633 0, ,7 3 0,0015 0,0015 0,9983 0,000 8,4 0 0,8 1 0,0 0,0 0,9679 0, ,6 63 0,068 0,068 0,386 0,

87 Distribuição Hipergeométrica Ex.: Pequenos motores elétricos são expedidos em lotes de 50 unidades. Antes que uma remessa seja aprovada, um inspetor escolhe 5 desses motores e os inspeciona. Se nenhum dos motores inspecionados for defeituoso, o lote é aprovado. Se um ou mais forem verificados defeituosos, todos os motores da remessa são inspecionados. Suponha que existam, de fato, três motores defeituosos no lote. Qual a probabilidade de que a inspeção 100% seja necessária? PX ( 1) = 1 PX ( = 0) =

88 Distribuição Hipergeométrica P( X 1) = 1 P( X = 0) 88

89 Distribuição de Poisson P( X = k) = λ = µ = np λ k λ k! Ex.: Em uma experiência de laboratório passam, em média, por um contador, quatro partículas radioativas por milissegundo. Qual a probabilidade de entrarem no contador seis partículas em determinado milissegundo? np Utilizando a distribuição de Poisson com λ = 4, então: e σ = µ = X = 0, 1,, L P( X = 6) = e 4 4 6! = No Minitab use: <Calc> <Probability Distribution> <Poisson> 6 89

90 Distribuição de Poisson Use o programa Statdisk <Analysis> <Probability Distribution> <Poisson Distribution> Observe em <Options> os valores acumulados 90

91 Distribuição de Poisson Exercício: Complete a tabela referente à Distribuição Poisson: Média k P(X=k) F(k) P(X>k) P(X<k)

92 Distribuição de Poisson Ex.: Chegam, em média, 10 naviostanque por dia a um movimentado porto, que tem capacidade para 15 desses navios. Qual a probabilidade de que, em determinado dia, um ou mais navios tanque tenham de ficar ao largo, aguardando vaga? Temos aqui que, para λ = 10: P( X > 15) = 1 P( X 15) = =

93 Distribuição de Poisson Ex.: Uma central telefônica recebe em média 300 chamadas por hora e pode processar no máximo 10 ligações por minuto. Estimar a probabilidade de a capacidade da mesa ser ultrapassada. Temos agora: λ = 300/60 = 5 chamadas/minuto em média P( X > 10) = 1 P( X 10) = = = 1,4% 93

94 Distribuição de Poisson Aproximação da Distribuição Binomial Seja X uma v.a. distribuída binomialmente com parâmetro p (baseado em n repetições de um experimento). Isto é, n PX k k p k ( = ) = ( p ) 1 Admita-se que quando n, p 0 e np λ. Nessas condições é possível demonstrar uma importante consideração: n k lim P( X n e = k) = k λ k! λ 94

95 Distribuição de Poisson Aproximação da Distribuição Binomial Ex.: A probabilidade de um indivíduo ter reação negativa a certa injeção é de 0,001. Determinar a probabilidade de que de.000 indivíduos injetados, exatamente 3 tenham reação negativa. Usando a distribuição binomial com n =.000 e p = temos: 000 P( X = 3) = (0.001) 3 3 (0.999) O cálculo desses números dá origem a considerável dificuldade. Pela aproximação de Poisson temos: 1997 α = np = ( 000)(0.001) = P( X = 3) = e 3! 3 =

96 Distribuição de Poisson Aproximação da Distribuição Binomial Ex.: Consideremos um experimento binomial com n = 00, p = 0.04 em que se pede a probabilidade de, no máximo, 5 sucessos. O cálculo direto é impraticável, usando a Distribuição Binomial P( X 5) = 5 k = 0 00 (0.04) k k (0.96) 5 k λ = np = (00) (0.04) = 8 P(X 5) = Obtido de Tabela (ou micro) 96

97 97 Ex.: A probabilidade de um indivíduo ter reação negativa a certa injeção é de 0,001. Determinar a probabilidade de que de.000 indivíduos injetados, mais de quatro tenham reação negativa. ( ) ( ) ( ) ( ) ( ) ( ) ! 1! 3! 4! 1 ] [ = = = = + = + = + = + = = > e e e e e X P X P X P X P X P X P Distribuição de Poisson 000)(0.001) = ( = = np α

98 3 - Estimação de Parâmetros e Intervalos de Confiança

99 Estimação de Parâmetros e IC Idéia Central: Criar e avaliar intervalos de Confiança para dados amostrais. Tópicos abordados: Inferência Estatística O Teorema Central do Limite Intervalos de Confiança A Distribuição t de Student. 99

100 População Estimação de Parâmetros - Noções Ex.: Para a distribuição normal os parâmetros são µ e σ. Amostragem Estimação de parâmetros e escolha da Distribuição Cálculo de Probabilidades (Usando a Distribuição acima) Informação para Inferência Estatística Os termos população e distribuição são equivalentes. tomada de decisão 100

101 Nomenclatura 101

102 O Teorema Central do Limite Para uma população não normal com média µ e desvio padrão σ, a distribuição da média amostral X para amostras de tamanho n suficientemente grande é aproximadamente normal com média µ e desvio padrão σ n, isto é: X µ ~ N : (0,1) Ou seja: Ζ = σ n Se X:(µ, σ) então a distribuição amostral de X é N(:(µ, ) σ n 10

103 TCL Para uma população normal com média µ e desvio padrão σ, a média amostral X para amostras de tamanho n suficientemente grande é aproximadamente normal com média µ e desvio padrão σ n, isto é: Ou seja: X µ Ζ = σ n ~ N : (0,1) Se X:N(µ, σ) então a média amostral de X é N:(µ, ) σ n Erro Padrão = Standard Error=SE= σ n 103

104 IC (µ :95%)... para Sigma conhecido Consideremos uma população normal com média µ, desvio padrão σ e uma amostra dessa população. X σ u n ~ N : (0,1) Pelos resultados do Teorema do Limite Central 0.95 Fixando α em 0.05, ou seja, 1- α=0.95, P( 1.96 < Z < 1.96) = X z 104

105 Confiança e Significância População normal com média µ e desvio padrão σ Pelos resultados do TCL: α : Nível de significância X u σ n P ~ N : (0,1) X µ P 1.96 < < 1.96 = 0.95 σ n 1- α: Nível de confiança P( 1.96 < Z < 1.96) = 0.95 [ X 1.96( σ n) < µ < X ( σ n) ] = [ ˆ ] θ ; ˆ θ = [ X 1.96( σ n ); X 1. 96( σ n )] =IC(µ :95%) 105

106 IC - Interpretação P [ X 1.96( σ n) < µ < X ( σ n) ] = Ela não significa que a probabilidade do parâmetro µ cair dentro de um intervalo especificado seja igual a µ sendo o parâmetro, está ou não, dentro do intervalo. θ 0.95 é a probabilidade de que um intervalo aleatório contenha µ. 106

107 IC (µ :95%)... para Sigma Desconhecido [ X t ( S n ) X t ( S n )] IC( µ : (1 α)100) = α ; + α t ( X µ) S = = n 1 i= 1 S n 1-α 1 n ( X i X ) α/ - t α/ 0 t α/ α/ t 107

108 (Distribuição t de Student) Distribuição t de Student, com v graus de liberdade v = n -1 t n ( X µ) 1 = S = n 1 i= 1 S n Normal h v (t) ( X i X ) Tal distribuição é usualmente tabelada para alguns valores de v e α t 108

109 Intervalos de Confiança para PROPORÇÕES Exemplo Uma amostra aleatória de 85 camisas, 10 apresentaram algum tipo de defeito (furos, manchas, costuras soltas etc). Construa um intervalo de confiança de 95% para a proporção populacional de defeituosos. ( 1 pˆ ) pˆ ( 1 pˆ ) pˆ pˆ Z p pˆ α + Zα n n Usando a aproximação pela NORMAL. 109

110 Tamanho de Amostra Exemplo Um candidato político deseja avaliar se as suas intenções de votos são maiores do que as do concorrente, com uma margem de pelo menos 5%. Possui, na última pesquisa realizada, 35% da preferência do eleitorado. Admitindo a = 1% e b = 5%, qual o tamanho de amostra necessária? 110

111 Power and Sample Size selecionar: Stat > Power and Sample Size > Proportions Proportion 1 values : < 0,35 > Power values : < 0,95 > Proportion : < 0,30 > selecionar: Options marcar Greater Then Significance level : < 0,01 > OK OK 111

112 4 TESTES DE HIPÓTESE

113 Experimentos Comparativos Simples Idéia Central: Estudar os experimentos envolvendo Teste de Hipóteses para um e dois tratamentos. Tópicos abordados: Teste de Hipóteses 113

114 Exemplos: Duas linhas de produção supostamente idênticas estão apresentando resultados diferentes. Como confirmar isso? A variabilidade de um processo é maior que outro. Temos certeza? Os dados estão normalmente distribuídos? Como saber estatisticamente se dois funcionários tem o mesmo desempenho? 114

115 Decisão Estatística Um produto original é identificado pelo seu peso (em libras) e reconhecidamente segue uma distribuição normal N(50; 0.8). Do mesmo modo, produtos falsificados tem pesos significativamente maiores que 50 lb, seguindo distribuição também normal N(5, 0.8). Uma amostra aleatória revelou um peso médio de 51,3 lb. Baseado nesta amostra a que conclusões se pode chegar? 115

116 Qual é a probabilidade de que (em função da amostra) um produto original seja classificado como Falso? Qual a probabilidade de que o produto original seja corretamente identificado? Qual a probabilidade de que um produto falsificado seja classificado como original? Qual é a probabilidade de se detectar produtos falsificados neste caso? 116

117

118 ,

119 , % Erro Tipo 1 (Alfa)

120 , % Erro Tipo (Beta) 5% Erro Tipo 1 (Alfa)

121 , CONFIANÇA (1-Alfa) % Erro Tipo (Beta) 5% Erro Tipo 1 (Alfa)

122 , CONFIANÇA (1-Alfa) POWER (1-Beta) % Erro Tipo (Beta) 5% Erro Tipo 1 (Alfa)

123 Na afirmação: Uma pessoa é considerada inocente até que se prove o contrário pois é um erro maior condenar um inocente do que libertar um culpado., defina: Erros Tipo I e Tipo II Hipóteses Nula e Alternativa H 0 : o réu é inocente (hipótese fundamental) H 1 : o réu é culpado (hipótese alternativa) 13

124 Hipóteses e Erros Os erros de julgamento poderiam ser : condenar um réu inocente ou, então, absolver um réu culpado. REALIDADE DECISÃO aceitar H 0 rejeitar H 0 H 0 verdadeira decisão correta 1 - α erro tipo I α H 0 falsa erro tipo II β decisão correta 1 - β 14

125 Tipos de Erros ERRO DO TIPO I Rejeitar Ho sendo Ho verdadeira P(Erro I) = P(rejeitar Ho Ho é verdadeira) = α ERRO DO TIPO II Não rejeitar Ho sendo Ho falsa P(Erro II) = P(não rejeitar Ho Ho éfalsa) = β 15

126 Construção de T.H. 1) Definir as hipóteses; ) Escolher a estatística de teste adequada; 3) Escolher α e estabelecer a Região Crítica (RC); 4) Com base em uma amostra de tamanho n, extraída da população, calcular θ; 5) Rejeitar Ho caso θ RC. Não rejeitar Ho em caso contrário. No Minitab: Análise do P-value! 16

127 Testes Paramétricos Testes de Hipóteses Estatísticas Os testes de hipóteses em Estatística podem ser empregados para avaliar ou comparar: médias; variâncias (ou desvios-padrão); proporções; distribuições de probabilidade e correlação. Estas análises podem se do tipo igual, menor que ou, ainda, maior que. 17

128 TH p/ Média Para avaliar médias, empregam-se dois diferentes tipos de testes: z ou t. o teste z é empregado somente se o desviopadrão da população (s) é conhecido (caso pouco provável); o teste t é utilizado nas demais circunstâncias e, por isso, este é que será visto no curso. 18

129 Ex. The production manager of a company has asked you to evaluate a proposed new procedure for producing its double-hung windows. The present process has a mean production of 80 units per hour with a population standard deviation of 8 units. The manager indicates that she does not want to change to a new procedure unless there is strong evidence that the mean production level is higher with the new process. A random sample of 5 units revealed the sample mean was 83. Based on this sample, is there strong evidence to support the conclusion that the new process resulted in higher productivity? 19

130 H H 0 1 : : µ µ > Z = X µ 0 σ n 130

131 P-Value P-Value é a área ou probabilidade que fica acima (ou abaixo) do valor obtido experimentalmente. P-Value = P(1-Ø) Quanto menor o P- Value, menor será a chance de se cometer um erro do tipo 1! 131

132 Alfa 13

133 Unilateral e Bilateral A α A1 Teste Unilateral Esquerdo P-Value = A1 Aceita-se Ho P-Value = A Rejeita-se Ho A1 α A Teste Unilateral Direito P-Value = A1 Aceita-se Ho P-Value = A Rejeita-se Ho A α/ A1 Teste Bilateral P-Value = A1+A 133

134 Exemplo A manufacturing process involves drilling holes whose diameters are normally distributed with population mean of inches and population standard deviation 0.06 inches. A random sample of 9 measurements had a sample mean of 1.95 inches. Use a significance level of 5% to determine if the observed sample mean is unusual and suggests that the drilling machine should be adjusted. H H 0 1 : µ = : µ Z = X µ 0 σ n 134

135 EXERCÍCIOS Question 1: A company which receives shipments of batteries tests a random sample of nine of them before agreeing to take a shipment. The company is concerned that the true mean lifetime for all batteries in the shipment should be at least 50 hours. From past experience, it is safe to conclude that the population distribution of lifetimes is normal, with standard deviation of 3 hours. For one particular shipment, the mean lifetime for a sample of nine batteries was 48. hours. Test at 5% level the null hypothesis that the population mean lifetime is at least 50 hours. 135

136 EXERCÍCIOS Question : An engineering research center claims that through the use of a new computer control system, automobiles should achieve on average an additional 3 miles per gallon of gas. A random sample of 100 automobiles was used to evaluate this product. The sample mean increase in miles per gallon achieved was.4 and the sample standard deviation was 1.8 miles per gallon. Test the hypothesis that the population mean is at least 3 miles per gallon using 5% significance level. Find the P-value of this test, and interpret your findings. 136

137 EXERCÍCIOS Question 3: A beer distributor claims that a new display, featuring a life-size picture of a well-known rock singer, will increase product sales in supermarkets by an average of 50 cases in a week. For a random sample of 0 liquor weekly sales, the average sales increase was 41.3 cases and the sample standard deviation was 1. cases. Test at the 5% level the hypothesis that the population mean sales increase is at least 50 cases. 137

138 EXERCÍCIOS Question 4: In contract negotiations, a company claims that a new incentive scheme has resulted in average weekly earning of at least $400 for all customer service workers. A union representative takes a random sample of 15 workers and finds that their weekly earnings have an average of $381.5 and a standard deviation of $ Assume a normal distribution. a) Test the company s claim; b) If the same sample results had been obtained from a random sample of 50 employees, could the company s claim be rejected at a lower significance level than in part (a)? 138

139 EXERCÍCIOS Question 5: A bearing used in an automotive application is supposed to have a nominal inside diameter of 1.5 inches. A random sample of 5 bearings is selected and the average inside diameter of these bearing is inches. Bearing diameter is known to be normally distributed with standard deviation 0.01 inch. Test the null hypothesis using a two-sided approach and considering. 139

140 EXERCÍCIOS Question 6: A process that produces bottles of shampoo, when operating correctly, produces bottles whose contents weigh, on average, 0 ounces. A random sample of nine bottles from a single production run yielded the following content weights (in ounces): 1,4 19,7 19,7 0,6 0,8 0,1 19,7 0,3 0,9. Assuming that the population distribution is normal, test at the 5% level against a two-sided alternative the null hypothesis that the process is operating correctly. 140

141 Exemplo 1Z A Resistência ao Estufamento das latas para a inspeção final deve ser maior que 90 psi. Tal resistência obedece a uma distribuição normal com desvio padrão de 1 psi. As medidas da Resistência para uma determinada linha/turno estão dadas na planilha Resistência.MTW Teste a Hipótese de que as medidas da Resistência ao Estufamento estão dentro do limite de especificação. (Prove que as medidas são maiores que 90) Gere: N(91; 0.83) 141

142 TH - Proporções H 0 : π π 0 H 0 : π π 0 H 0 : π = π 0 H 1 : π < π 0 H 1 : π > π 0 H 1 : π π 0 T.U.E T.U.D Bilateral H 0 : π 1 π H 0 : π 1 π H 0 : π 1 = π H 1 : π 1 < π H 1 : π 1 > π H 1 : π 1 π T.U.E T.U.D Bilateral Onde: π é a proporção populacional e π 0 é uma constante 14

143 Exemplo 1 Proportion Em uma indústria de autopeças, historicamente 3,5% das peças produzidas contém algum tipo não-conformidade. Uma equipe está trabalhando na redução desta incidência de defeitos e, no último mês, foram produzidas 1500 peças e somente 45 estavam fora da especificação. A equipe obteve melhoria no desempenho? H 0 : π 0,035 H 1 : π < 0,

144 <Stat > <Basic Statistics > <1 Proportion> Selecione Summarized data Number of trials : p = = 3,0% Number of successes : Options test proportion : < 0,035 > π 0 alternative : < less than > 144

145 Uma equipe deseja aumentar a porcentagem (ou proporção) de pedidos aceitos pelos clientes. A equipe acredita ter identificado uma das causas de perdas de pedidos que é o prazo elevado para envio da cotação ao cliente. Conseguiram reduzir este tempo e os resultados das últimas 10 semanas estão fornecidos no arquivo pedidos.mtw. Qual é a conclusão? 145

146 Proportions <Stat > <Basic Statistics > < Proportions> Selecione Samples in different columns First= antes Second= depois Options test difference : < 0 > alternative : < less than > Obs: no arquivo, s indica pedido aceito, e n, pedido recusado 146

147 Test and CI for Two Proportions: antes; depois Success = s Variable X N Sample p antes ,55814 depois , Estimate for p(antes) - p(depois): -0, % upper bound for p(antes) - p(depois): -0, Test for p(antes) - p(depois) = 0 (vs < 0): Z = -1,87 P-Value = 0,031 Rejeita-se H 0 147

148 <Stat><Basic Statistics> <1 Sample Z> Selecione Resistencia Sigma=1 (isso geralmente não é fornecido) Test mean= 90 <Options> Alternative= Greater than <Graphs...> Individual plot 148

149 One-Sample Z: Resistencia H0 H1 Test of mu = 90 vs mu > 90 Uma boa regra: Se P-Value < α, rejeita-se H o The assumed sigma = 1 Valor dentro da Região Crítica Variable N Mean StDev SE Mean Resistencia 15 91,111 0,834 0,58 Variable 95,0% Lower Bound Z P Resistencia 90,686 4,30 0,000 Região Crítica Rejeita-se H0 149

150 Exemplo 1t Teste de média t para 1 amostra A especificação da Largura da Flange das latas para a inspeção final é definida como / e obedece a uma distribuição normal. As medidas da Largura da Flange para uma determinada linha/turno estão dadas na planilha. Teste a Hipótese de que as medidas da Largura da Flange estão dentro do limite de especificação. (Prove que os valores são em média maiores que 0,07 e menores que 0,09 ) Gere: N(0.0835; ) 150

151 <Stat><Basic Statistics> <1 Sample t> Selecione Largura Flange Test mean= 0,09 <Options> <Graphs...> Alternative= Less than Histogram of data Teste (Para provar que os valores são maiores que 0,07) <Stat><Basic Statistics> <1 Sample t> Selecione Largura Flange Test mean= 0,07 <Options> <Graphs...> Teste 1 (Para provar que os valores são menores que 0,09) Alternative= Greater than Histogram of data 151

152 1Z e 1t Teste de Hipótese para Médias Uma amostra H 0 : µ µ 0 H 0 : µ µ 0 H 0 : µ = µ 0 H 1 : µ < µ 0 H 1 : µ > µ 0 H 1 : µ µ 0 T.U.E T.U.D Bilateral Z = X 0 Teste Z: 0 Teste T: σ / µ n T = X S µ 0 / n 15

153 : : µ µ µ µ < H H : : µ µ µ µ > H H : : µ µ µ µ = H H Teste de Hipótese para Médias Duas amostras T.U.E Bilateral T.U.D ( ) n n X X Z σ σ µ µ + = Variâncias Conhecidas ( ) n n S X X T p + = µ µ Variâncias Desconhecidas Z e t

154 t Cálculo da Variância Estimador Combinado S p = ( ) n ( ) 1 1 S1 + n 1 ( n 1) + ( n 1) 1 S S : Variância Amostral Grupo 1 S : Variância Amostral Grupo 1 n 1 : Tamanho do Grupo 1 Tamanho do Grupo n : 154

155 : : σ σ σ σ < H H TH p/ Variâncias T.U.E Bilateral T.U.D 1 0 S S F = Estatística de Teste: : : σ σ σ σ > H H : : σ σ σ σ = H H

156 Exemplo Dois tipos de Bico de Aplicação de verniz (Tipo I e Tipo II) foram avaliados. Deseja-se investigar o efeito desses dois Bicos com relação ao Peso do Verniz (em mg) medido após o processo. Tais medidas são dadas na planilha ao lado. As variâncias são iguais? (Teste a Hipótese nula de que os dois bicos produzem um peso de Verniz com mesma variância.) Peso_Verniz.MTW 156

157 <Stat><Basic Statistics> < Variances> Selecione Samples in different columns First= Verniz_tipo1 Second= Verniz_tipo Obs.: Teste o Procedimento Stack Columns Para usar Samples in one column 157

158 Levene s Test Test for Equal Variances for Verniz_tipo1; Verniz_tipo F-Test Verniz_tipo1 Test Statistic,74 P-Value 0,150 Levene's Test Verniz_tipo Test Statistic 1,51 P-Value 0,36 Verniz_tipo1 Verniz_tipo 0, 0,4 0,6 0,8 1,0 95% Bonferroni Confidence Intervals for StDevs As variâncias são iguais! 1, Prefira sempre, pois independe da distribuição dos dados. 110,0 110,5 111,0 Data 111,5 11,0 11,5 158

159 Test for Equal Variances Após empilhamento dos dados faça: <Anova> <test for equal variances> Esse método é melhor, pois pode testar mais que dois conjuntos de dados. Bonferroni confidence intervals for standard deviations Lower Sigma Upper N Factor Levels Verniz_tipo Verniz_tipo F-Test (normal distribution) Test Statistic:.738 P-Value : Levene's Test (any continuous distribution) Test Statistic: P-Value : 0.36 (variâncias iguais) 159

160 Exemplo: Em relação ao problema anterior, teste se as médias são diferentes. (Peso_Verniz.MTW) <Stat><Basic Statistics> < Sample t> Selecione Samples in different columns First= Verniz_tipo1 Second= Verniz_tipo Selecione: Assume equal variances <Options> <Graphs> Test mean= 0 Alternative= not equal Selecione Boxplots of data 160

161 Two-Sample T-Test and CI: Verniz_tipo1, Verniz_tipo Two-sample T for Verniz_tipo1 vs Verniz_tipo N Mean StDev SE Mean Verniz_t Verniz_t Difference = mu Verniz_tipo1 - mu Verniz_tipo Estimate for difference: % CI for difference: (-1.838, ) T-Test of difference = 0 (vs not =): T-Value = P-Value = DF = 18 Both use Pooled StDev = Médias diferentes 161

162 Boxplot of Verniz_tipo1; Verniz_tipo 11,5 11,0 Data 111,5 111,0 110,5 110,0 Verniz_tipo1 Verniz_tipo 16

163 163 Observações Emparelhadas 0 : 0 : = = = µ µ µ µ H H 0 : 0 : < = = µ µ µ µ H H 0 : 0 : > = = µ µ µ µ H H n S D T D / 0 0 = Diferença Amostral Média Desvio Padrão das diferenças entre 1 e Paired t

164 Paired t - Características Consiste em dois testes (um antes e outro depois) com a mesma unidade experimental (amostra). Ex.: O peso de pessoas antes e depois de um tratamento. Em geral, as unidades experimentais são heterogêneas (σ grande) e exibem alta correlação positiva. 164

165 Exemplo - Paired t Suspeita-se que dois funcionários estão monitorando o manômetro de um processo de uma forma desigual. Para diferentes pressões foram lidas (de uma forma emparelhada) os resultados da planilha ao lado. Teste a Hipótese de que os dois operadores tem o mesmo desempenho. 165

166 Paired t <Stat><Basic Statistics> <Paired t> Selecione Samples in columns First sample= Operador 1 Second sample= Operador <Options> Test mean= 0 Alternative= not equal <Graphs> Individual value plot 166

167 Paired T-Test and CI: Operador 1, Operador Paired T for Operador 1 - Operador N Mean StDev SE Mean Operador Operador Difference % CI for mean difference: (-3.169, ) T-Test of mean difference = 0 (vs not = 0): T-Value = P-Value = Médias diferentes 167

168 Power Sample Size Tamanho de Amostras em Testes de Hipóteses Fatores determinantes do Tamanho da Amostra (n) Fonte Efeito sobre n 1 Desvio Padrão dos dados Deve ser estimado. Quando o Desvio Padrão diminui, n cresce. Nível de Significância (α) Em geral, Se α diminui, n cresce. 3 4 Diferença a ser detectada (d) Poder do Teste: (1-β) Probabilidade de detectar uma diferença quando ela realmente existir. Você decide o tamanho adequado. Usualmente, 90% Quanto menor for a diferença desejada, maior n. Se o poder do teste cresce, n cresce. 168

169 Exemplo Uma equipe de melhoria desenvolveu um novo procedimento de manutenção. Espera-se que o tempo de manutenção diminua com a utilização do novo procedimento. Para identificar se as mudanças foram eficazes, a equipe decide coletar amostras dos dois processos: o novo e o antigo. 169

170 Questionamentos Questão 1: Qual o teste de Hipóteses adequado para esta situação? Sample-t (média de dois grupos) Questão : Que Informações são necessárias para se determinar o tamanho de amostra necessária ao teste? Uma estimativa do desvio padrão do tempo de manutenção; A diferença que deve ser detectada entre os tempos médios dos dois processos; A probabilidade de detectar esta diferença (Geralmente 90%); O nível de significância desejado (Geralmente5%); 170

171 Questão 3: Que suposições a equipe está fazendo? Que o processo é estável; Que os dados são Normais. Questão 4: Como estas suposições podem ser verificadas? Carta de Controle; Teste de Normalidade. 171

172 Exemplo Verificação 10 UCL=118 Time (minutes) X=87 LCL= Examinando-se a carta de controle, verifica-se: O processo é estável e a média atual é 87 minutos 17

173 10 UCL= Time (minutes) X= LCL= UCL LCL 6 = = 10.3 UCL Avg 3 = = 10.1 Portanto, pode-se adotar um desvio padrão de

174 Se a equipe deseja provar que o tempo médio de manutenção utilizando-se o novo procedimento é de 75 minutos, e se considerarem a probabilidade de 90% de chance de detecção desta diferença (1 minutos), com um nível de significância de 0,05, qual será o tamanho da amostra necessária? 174

175 <Stat > <Power and Sample Size> < Sample t> Differences= 1 Power values= 0,9 Sigma= 10 <Options> Selecione Not equal como Alternative Hypothesis 175

176 -Sample t Test Testing mean 1 = mean (versus not =) Calculating power for mean 1 = mean + difference Alpha = 0,05 Sigma = 10 Sample Target Actual Difference Size Power Power ,9000 0,907 Tamanho de amostra necessária. 176

177 5 ANÁLISE DE VARIÂNCIA (ANOVA)

178 ANOVA Análise de Variância As bases da Análise de Variância Um fator (One-way) Dois fatores (Two-way) Análise de Médias (ANOM) Balanced ANOVA ANOVA é um Teste para Comparar Médias (O nome é enganoso!) 178

179 ANOVA - Visualmente Entendendo o significado da ANOVA

180 As Bases da ANOVA Tratamentos A B C Resposta Somatório Médias H H 0 1 : µ A = µ B = µ C : Pelo menos um dos sinais As médias são realmente diferentes ou tudo não passa de casualidade? = vai ser negado 180

181 Algoritmo: Variação Total Média geral (A, B e C) Passo 1: Cálculo da Variação Total X i X X = i 5 5-7= =-3 9 Etc. Etc. Etc Foram considerados 15 observações: Glib=14 x i x i VT - Variação Total Como VT>0 é razoável imaginar que ela se compõe de variações que ocorrem Dentro dos Grupos (VD - Within) e Entre os tratamentos (VE - Between) 181

182 Algoritmo: Variação Within X A Passo : Cálculo da Variação Dentro do Grupo - Within X A X A ( X X ) A 5 5-6=-1 1 A VD= =86 ( B ) X B X ( X ) C X C Foram considerados 5 observações em cada caso: Glib=1 18

183 Algoritmo: Variação Between X A Passo 3: Cálculo da Variação Entre Tratamentos (Between) X A X ( X A X ) VE=5+0+5=10 5 ( X B X ) 0 5 ( X C X ) Foram considerados 3 observações : Glib= 183

184 Algoritmo: Graus de Liberdade VT=VD+VE! 96=86+10 Graus de Liberdade: A VT possui (15-1)=14 GLIB (3 Tratamentos) (5 Observ/Trat) A VD possui (5-1)(3)=1 GLIB (5 Observ/Amostra)(3 Amostras) A VE possui (3-1)= GLIB A B C (3 Tratamentos -1) GLIBVT=GLIBVD+GLIBVE! 14=

185 Algoritmo: Teste de Fisher para Médias VT=VD+VE! 96=86+10 GLIBVT=GLIBVD+GLIBVE! 14=1+0 Estimativas de Variâncias: VD/GLIBVD = 86/1 = 7,17 VE/GLIBVE= 10/ = 5 F0= 5/7,17=0,70 Fcrítico= 3,89 (em função dos GLIBVE GLIBVD e alfa=5% F0<Fcrítico Não se Rejeita Ho 185

186 Algoritmo: Quadro resumo Quadro Resumo Básico Fonte de Variação Própria Variação GLIB Variância Estimada F0 VE 10 10/=5 5/7,17=0,70 VD /1=7,17 VT

187 Minitab <ANOVA>One-Way Unstacked One-way ANOVA: A; B; C (use unstacked) Analysis of Variance Source DF SS MS F P Factor 10,00 5,00 0,70 0,517 Error 1 86,00 7,17 Total 14 96,00 Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev A 5 6,000 1,581 ( * ) B 5 7,000 3,808 ( * ) C 5 8,000,11 ( * ) Pooled StDev =,677 4,0 6,0 8,0 10,0 187

188 One-Way ANOVA Exemplo Na definição do Setup dos fatores para o processo Inside Spray quatro conjuntos de níveis para os parâmetros de Temperatura foram avaliados. Deseja-se investigar o efeito desses quatro Setups com relação a Distribuição do Verniz interno no fundo para cerveja medidas em mg/pol após o processo. Tais medidas são dadas na planilha ao lado. 188

189 ANOVA One-Way (Unstacked) ANOVA One-Way (Unstacked) Usar o Procedimento Stack Columns para executar o Teste ANOVA One-Way (preferível pois faz a análise de resíduos!!) 189

190 ANOVA One-Way: Resultados As médias são diferentes 190

191 ANOVA One-Way: Boxplots Boxplots of Setup1 - Setup4 (means are indicated by solid circles) Setup1 Setup Setup3 Setup4 191

192 ANOVA One-Way: Residuals x Fitted Residuals Versus the Fitted Values (response is mg) Residual Fitted Value 19

193 Exemplo No processo Bodymaker desejase investigar a Profundidade do Dome em função de 3 conjuntos de parâmetros (envolvendo pressão, Temperatura Vazão, etc...) e também em dois turnos de operação. Foram então colhidas amostras da Profundidade do Dome (em polegadas) para diferentes Turnos e diferentes Conjuntos de Parâmetros. Two-Way ANOVA Processo de fabricação de latas Anova_.MTW 193

194 ANOVA Two-Way: Follow along 194

195 ANOVA Two-Way: Resultados Diferentes Iguais 195

196 ANOM Análise de Médias Exemplo 3 Foram avaliados três níveis de pressões de ar draw pad (em psi) e também três níveis de pressões de ar blow off (em psi) na influência de problemas visuais após o processo Minster. O número de defeitos visuais (Riscos, Abaulamento, orelhas, rebarbas, rugas e ovalização) está mostrado na planilha ao lado. Anova_3.MTW ANOM: Para identificar qual média é diferente e avaliar a Interação! 196

197 ANOM Isso é melhor estudado em DOE! 197

198 ANOM: Gráficos Não há interação entre as pressões Blow e Draw. O Efeito de Blow é significativo! 198

199 ANOM: Resultados Blow Draw A Pressão Blow afeta mais a média 3,0 e 8,83 são valores distantes de 6, 199

200 Balanced Anova Exemplo 5 Processo de fabricação de latas Deseja-se avaliar o tempo gasto (em minutos) por seis funcionários para ajustar o Setup de dois processos (I e II) usando dois diferentes procedimentos (um novo e um antigo). A planilha seguinte mostra os resultados obtidos. Isso é a base para DOE - Delineamento de Experimentos! Anova_5.MTW 00

201 Balanced ANOVA 01

202 Balanced ANOVA: Resultados Diferentes 0

203 TWO-WAY Ex.6: An engineer suspects that the surface finish of metal parts is influenced by paint used and the drying time. Using a 5% significance level, test the influence of these two factors as also its interaction. 03

204 TWO-WAY Drying Time (min) Paint Total (yi..) Total: (y.j.) (y ) 04

205 TWO-WAY Ex.7: Am experiment describes na investigation about the effect of glass type and phosphor type on the brigtness of a television tube. The response is the current (ma) necessary to obtain a specified brightness level. Using a 5% significance level, test the influence of these two factors as also its interaction. 05

206 6 CORRELAÇÃO E REGRESSÃO

207 Análise de Regressão Correlação Procedimentos Gerais Y=f(X) Regressão linear Ajuste da Regressão Regressão linear Múltipla Best Subsets A análise de regressão é uma técnica estatística usada para modelar e investigar a relação entre duas ou mais variáveis. O modelo é freqüentemente usado para previsões. Regressão é um teste de hipótese H a : O modelo permite significativamente prever a resposta. 07

208 Coeficiente de Correlação Ex.: Suponha que o nosso desejo seja o de quantificar a associabilidade entre duas variáveis relacionadas a cinco agentes de uma seguradora. Assim, temos: X Anos de experiência do agente. Y Número de clientes do agente. Clientes Diagrama de Dispersão Agente x y A 48 B 4 56 C 5 64 D 6 60 E (x, y) é um par aleatório Dados emparelhados Anos de Experiência

209 r=correlação de Pearson y x x x y y y s y y = z y x x = s x z x Série de dados originais (x e y) são valores quantitativos. r = Corr ( X O conjunto de pontos é deslocado, tendo agora como centro, os valores médios., Y ) = 1 n n i= 1 z x i z y i A escala de x e y é agora padronizada. Isso torna os valores independente da sua unidade. 09

210 Coeficiente de Correlação y y Agente x y x x z x z y z x. z y A ,5 B ,5 C D E ,5 Total ,75 x = 5 S x = y = 60 4,75 S y = 8 r = Correlação ( X, Y ) = = 0,95 = 95% 5 10

211 P_value p/ Correlação r n = X Y = 1 Corr (, ) zx z i yi n = 1 n n i= 1 i= 1 x i s x x y i s y y r = ( x x)( y y) 1 i i Covariância ( XY, ) = n s s s s x y x y 1 r 1 A correlação apresentada aqui é linear. Existem outros tipos de correlação! Agente x y A 48 B 4 56 C 5 64 D 6 60 E 8 7 Ex.: Cálculo da correlação da tabela ao lado Pearson correlation of Anos Exp and Clientes = 0,950 P-Value = 0,013 Forte Correlação pois P-Value <0,05 11

212 Correlação no Minitab Faça a análise de Correlação das variáveis ao lado na planilha Bidimensional.mtw O Coeficiente de Correlação é também chamado de Coeficiente de Pearson. 1

213 Algumas questões sobre Correlação: A) Uma medida de Correlação fornece dois tipos de informações a respeito do relacionamento de duas variáveis. Quais são elas? B) Qual coeficiente de correlação abaixo indica o mais forte relacionamento? a) 0.70 b) 0.03 c)-0.77 d) 0.10 C) Se a correlação Rxy=0.45, então Ryx= D) Qual o valor do coeficiente de correlação melhor descreve os seguintes valores das variáveis X e Y, relacionadas abaixo: X: Y: a) -1.0 b) 0.0 c) 0.5 d) 1.0 E) Qual a correlação do gráfico abaixo? 13

214 Algumas questões sobre Correlação: F) Se um coeficiente de correlação for de +1.4, o que ocorre? a) O Relacionamento é extremamente forte b) O Relacionamento é positivo c) As respostas acima estão corretas d) Um erro computacional foi cometido G) Um coeficiente de Pearson de -0.5 entre os valores de Leitura (X) e o número de dias ausentes da escola (Y) indica que: a) Metade dos valores de Leitura são menos do que o número de dias ausentes da escola b) Maiores valores de Leitura são associados com menor ausência da escola c)a soma do produto XY é igual a -0.5 d) Quase não existe relacionamento entre X e Y 14

215 Variável Comum Dia Fator 1 Fator Resultado 1 Água Whisky Ficou Bêbado Água Vodka Ficou Bêbado 3 Água Rum Ficou Bêbado 4 Água Bourbon Ficou Bêbado 1995 Six Sigma Academy Inc. Conclusão: a água embebeda É comum associar-se um defeito com uma variável que está sempre presente quando ele ocorre (é o caso do operador que é culpado, pois quando ele executa a operação ocorre um defeito Toda operação geralmente tem um operador). 15

216 As armadilhas : correlações casuais Se a história servisse de base, os Republicanos deveriam estar vestindo a camisa dos Yankees e dando uma força para o New York vencer o campeonato. Desde a Segunda Guerra Mundial, toda vez que os Yanks venceram em um ano de eleição, o Partido Republicano assumiu a Casa Branca. Variável Comum Yankees Republicanos GANHARAM PERDERAM GANHARAM PERDERAM 16

217 As armadilhas : causa reversa Um fator X tem influência sobre um Y quando, na verdade, o que ele está vendo é a conseqüência do Y. Um exemplo deste caso é o do Departamento de Vendas que insatisfeito com as Vendas resolve dar uma série de descontos e faz promoções para atrair os clientes. Só que a verdadeira causa do problema é o Serviço de Atendimento ao Cliente. Com os novos descontos e a nova promoção fica mais difícil ainda administrar o Serviço de Atendimento ao Cliente, ocasionando num aumento da insatisfação do cliente e diminuindo mais ainda as vendas ( o tiro saiu pela culatra ). 17

218 As armadilhas : fatores omitidos Pesquisas continuamente demonstram que a medida que o tamanho dos hospitais aumenta, a taxa de mortalidade dos pacientes aumenta dramaticamente. Portanto, deveríamos evitar hospitais grandes? Esta análise é enganadora, pois omite um segundo X (fator) importante -- a gravidade da condição do paciente quando é admitido ao hospital. Os casos mais sérios tendem a ser levados aos hospitais maiores! Fumar cigarros causa câncer? E se eu dissesse que... (1) Médicos franceses não encontram esta correlação; () O tabaco dos EUA geralmente é exposto a pesticidas, fertilizantes e preservativos contendo substâncias conhecidamente cancerígenas, e; (3) O tabaco francês raramente entra em contato com tais substâncias químicas. 18

219 O Fazendeiro Radiofóbico Em Em 1950, 1950, um um fazendeiro fazendeiro afirmou afirmou que que suas suas árvores árvores frutíferas frutíferas estavam estavam sendo sendo prejudicadas prejudicadas pelas pelas ondas ondas de de rádio rádio de de uma uma estação estação local local próxima. próxima. Ele Ele colocou colocou uma uma tela tela de de arame arame ao ao redor redor de de algumas algumas das das árvores árvores para para protegê-las protegê-las destas destas ondas ondas de de rádio rádio e, e, realmente, realmente, as as árvores árvores protegidas protegidas se se recuperaram recuperaram rapidamente, rapidamente, enquanto enquanto que que as as desprotegidas desprotegidas ainda ainda sofriam. sofriam. Na Na mesma mesma época, época, muitas muitas árvores árvores cítricas cítricas em em todo todo país país foram foram ameaçadas ameaçadas por por uma uma doença doença chamada chamada de de folha folha pequena. pequena. Alguns Alguns fazendeiros fazendeiros Texanos Texanos descobriram descobriram que que uma uma solução solução de de sulfato sulfato de de ferro ferro curava curava a doença. doença. No No entanto, entanto, nem nem sempre sempre funcionava funcionava no no Texas, Texas, e praticamente praticamente nunca nunca funcionava funcionava na na Flórida Flórida ou ou na na Califórnia. Califórnia. O mistério mistério foi foi desvendado desvendado quando quando o problema problema verdadeiro verdadeiro foi foi revelado revelado -- --deficiência de de zinco zinco no no solo. solo. A cerca cerca do do fazendeiro fazendeiro Radiofóbico Radiofóbico era era de de tela tela galvanizada, galvanizada, sendo sendo que que traços traços do do zinco zinco da da galvanização galvanização eram eram levados levados da da tela tela para para o solo. solo. O sulfato sulfato de de ferro ferro nada nada tinham tinham a ver ver com com a cura, cura, mas mas sim sim os os baldes baldes de de ferro ferro galvanizados galvanizados usados usados para para espalhar espalhar a substância! substância! Em Em outras outras regiões, regiões, onde onde outros outros tipos tipos de de baldes baldes eram eram usados, usados, as as árvores árvores continuaram continuaram doentes. doentes. 19

220 As armadilhas : multicolinearidade É difícil saber o quê causa o quê, quando alguns fatores [X s] tendem a ocorrer juntos regularmente. Tenho visto uma redução dramática nas perdas desde que comecei a implementar as ferramentas estatísticas na fábrica! No entanto, foi exatamente na mesma época em que o RH introduziu seu novo sistema de recompensa e reconhecimento. O que ocasionou a melhoria? Em 1967, um artigo rotulou um determinado tipo de carro como sendo inseguro. O modelo em questão era um carro pequeno esportivo de alto desempenho. Mas que tipo de motorista seria atraído a tal carro? E se eu dissesse que a maioria dos proprietários deste carro tendiam a ser motoristas jovens menores de 5 anos com novas idéias. Esta faixa etária não paga prêmios de seguro mais elevados devido a maior incidência de acidentes? 0

221 Y=f(x) y Linha de Regressão A variável X é dita variável independente (ou exógena), enquanto Y é dita variável dependente (ou endógena). x Y=f(x) Simples Y=f(x,y,z...) Múltipla 1

222 Regressão Linear Simples (Um X) Múltipla (Dois ou mais Xs) Curvilínea (Um X) Y Y Y X X X 1 X Curvilínear (Dois ou mais Xs) Variáveis Indicativas (para Xs Discretos) 1 Logística (Ys Discretos) X a Y Y x x x x x x x x x x x x x x x X b X c % yes X 0 X 1 X i X

223 Resíduos y y = α + βx Curva de Resíduos (e) y ˆ = a + bx, x 1 x x 3 x Uma importante condição para o uso de regressão simples é que os resíduos (e) sejam independentes de x. Porque? 3

224 Regressão Linear Simples 8 7 y ˆ = a + bx y 6 5 ei ŷ i ei y i n Σ i = 1ei 4 3 min n ( y y ) = minσ ( y a bx ) n n Σ ˆ i= 1ei = minσi= 1 i i i= 1 i i x

225 A matemática da Regressão Linear Σ e n i= 1 i y ˆ = a + bx min ( ) n y y = minσ ( y a bx ) n n Σ ˆ i= 1ei = minσi= 1 i i i= 1 i i a n = 0 e n d = 1 i= b i i d 1 i = 0. n i= 1 n i= 1 ( y x i i ( y i a bx a i ) = bx i ) 0, = 0, 5

226 6 = = = = =,, ) ( ) ( 1 1 bx y a S S x x y x x b xx xy n i i n i i i + = = + = = = = = n i n i n i i i i n i n i i x i b x a y x i x b na y , 1 Ufa!

227 Exemplo Ex.: Obter a equação da reta (chamada de reta dos mínimos quadrados) para os seguintes pontos experimentais: x y 0,5 0,6 0,9 0,8 1, 1,5 1,7,0 Traçar a reta no diagrama de dispersão. Calcular o coeficiente de correlação linear. Qual o valor previsto para x=9? Qual a Tolerância de X para 1<Y<1.5? 7

228 Regressão: By Hand S S xy xx = = 36 9, 50,5 = 50,5 41,4 = 9,1, 8 (36) 04 = =

229 Regressão: Cálculos S S xy xx = = 36 9, 50,5 8 (36) 04 = 8 = 50,5 41,4 = = 4. 9,1, b a = = S S y xy xx 9,1 = 0,17, 4 9, bx 0, = 1,150 0,976 = 0,174. yˆ = 0, , 17x 9

230 Regressão: Gráfico Fitted Line Plot y = 0, ,167 x,00 1,75 S 0,11335 R-Sq 95,7% R-Sq(adj) 95,0% 1,50 y 1,5 1,00 0,75 0, x

231 Regressão: Correlação S yy = 1,64 (9,) 8 = 1,64 10,58 =,06, r = S S xx xy S yy = 9,1 4,06 0,98 Relembre Correlação! 31

232 Regressão linear simples no Minitab Previsão 3

233 Ajuste da Regressão Linear R-quadrado é a porcentagem da variação explicada pelo seu modelo. R-quadrado (ajustado) é a porcentagem da variação explicada pelo seu modelo, ajustada para o número de termos em seu modelo e o número de pontos de dados. O valor-p para a regressão é para ver se o modelo de regressão inteiro é significativo. H a : O modelo permite significativamente prever a resposta. 33

234 Ajuste Quadrático Quadrático 34

235 Ajuste Cúbico Cúbico 35

236 Ajuste da Regressão Intervalos de confiança e de previsão Uma faixa (ou intervalo) de confiança é uma medida da certeza da forma da linha de regressão ajustada. Em geral, uma faixa de 95% implica em uma chance de 95% de que as linha verdadeira fique dentro da faixa. [Linhas vermelhas] Uma faixa (ou intervalo) de previsão é uma medida da certeza da dispersão dos pontos individuais em torno da linha de regressão. Em geral, 95% dos pontos individuais (da população em que a linha de regressão se baseia) estarão contidos dentro da faixa. [Linhas azuis] 36

237 Estreitando Tolerâncias CTQ 1 37

238 Estreitando Tolerâncias CTQ

239 Pratique Regressão Linear Simples Determine a função de transferência entre o Número de Setups e o Tempo de Ciclo para diversas operações em uma certa empresa. Use a planilha cycletime.mtw. Faça a análise de Resíduos. Qual a previsão do Tempo de Ciclo para uma operação que consiste em 10 Setups de equipamento? A equação final é adequada? Se não for, como melhorá-la? 39

240 Regressão Múltipla Uma reação Química foi realizada sob seis pares de diferentes condições de pressão e temperatura. Em cada caso foi medido o tempo necessário para que a reação se completasse. Obter a equação de regressão do tempo em relação a pressão e temperatura. Regressão.mtw 40

241 Regressão Múltipla: Resultados Menores que 0,05 Maior melhor 41

242 Best Subsets 9 estudantes americanos participam de um simples experimento. Cada estudante registra o seu peso, altura, gênero, pulso e se é fumante ou não. Todos eles jogam uma moeda e sorteiam se vão dar uma corrida (cara) ou não por um minuto. Após a corrida, todos os alunos registram o seu pulso novamente. Um aluno sugere que seja inserida a seguinte importante consideração: Se a pessoa pinta o cabelo ou não. Regressão.mtw Deseja-se fazer uma regressão do segundo pulso em relação a todas as outras variáveis. 4

243 Best Subsets: Resultados Equação de regressão inicial. Muito complexa Correlação muito alta. Quem pinta cabelo é geralmente mulher 43

244 Best Subsets: Resultados Melhor ajuste 44

245 Análise de Resíduos Bom Ruim Residuals vs Each X Time Plot of Residuals Residuals vs Predicted Y (Fits) Residual Residual Residual X Time Order Pred. Y Residual Residual Residual X Time Order Pred. Y Nos casos ruins tente uma transformação em X,em Y ou ambos. Use Box-Cox Transformation Considere a possibilidade da existência de variáveis ocultas que não foram consideradas no modelo (Lurking) Normal Probability Plot of Residuals Nscore Balestrassi Residual Paiva Ferreira Residual (UNIFEI IEPG) Nscore Entenda que X e Y não precisam ser normalmente distribuídos. Os resíduos, contudo, deveriam ser. 45

246 Regressão Curvilínea Um laboratório está fazendo testes em adesivos em função da temperatura. Quando a temperatura aumenta a força do contato entre duas superfícies aumenta Em um determinado ponto, contudo a força desse contato começa a diminuir em função de propriedades térmicas do adesivo. Qual o modelo empírico da força (Seal Strength) em função da temperatura? Seal Strength (g/cm) Curve.mtw Temperature 46

247 Termo quadrático da regressão Deve-se criar a variável quadrática e em seguida rodar o modelo em Regression Termo quadrático Função quadrática Observe resíduos VIF Armazena resíduos 47

248 Regressão Curvilínea The regression equation is SealStrength = Temperature TempSqrd X e X são fortemente correlacionados. Nenhuma surpresa X X Predictor Coef StDev T P VIF Constant Temperat TempSqrd S = 5.18 R-Sq = 69.4% R-Sq(adj) = 68.7% Analysis of Variance Conclusão: Existe uma curvatura significativa Source DF SS MS F P Regression Residual Error Total Source DF Seq SS Temperat TempSqrd

249 PORTFÓLIO Ex.1: De acordo com os dados da tabela ao lado, há correlação entre o preço de um produto e o respectivo volume de vendas? n PREÇO VENDAS 1 5,5 40 6, , , , , , ,

250 PORTFÓLIO Exercício : A liquor wholesaler is interested in assessing the effect of the price of a whiskey on the quantity sold. The results in table represent the price (US$) and the respective eight weeks of sales. What are your conclusions? n Price Sales 1 19, 5,4 0,5 14,7 3 19,7 18,6 4 1,3 1,4 5 0,8 11,1 6 19,9 15,7 7 17,8 9, 8 17, 35, 50

251 PORTFÓLIO Exercício 3: Doctors are interested in the relationship between the dosage of a medicine and the time required for a patient s recovery. Based on the following data, verify if the variables are correlated. n Dosage Recovery Time 1 1, 5 1, , , 7 5 1,

252 PORTFÓLIO Exercício 4: The table shows, for eight vintages of select wine, purchase per buyer (y) and the wine buyer s rating in a year (x). Are the variables correlated? n x y 1 3,6 4 3,3 1 3,8 4,6 5,7 18 6,9 13 7,0 9 8,6 6 * Vintage: safra de vinho 5

253 Exemplo: Determine a correlação entre o tempo de experiência e o salário anual do funcionário e se existe diferença significativa entre os salários dos homens e das mulheres. (Use Anova e -sample t) Mulheres Salário ($) Experiência Homens Salário ($) Experiência

254 PORTFÓLIO Exercício 6: Determinar a composição ótima da seguinte carteira: A B Retorno: 0,15 0,0 D.P. : 0,0 0,30 Variância: 0,04 0,09 54

255 PORTFÓLIO Exercício 7: Determinar a composição ótima da carteira formada pelos ativos a seguir, considerando-se um retorno mínimo de 9%. n ATIVO 1 ATIVO 1 0,15 0,1 0,17 0,13 3 0,04 0,09 4-0,08 0,07 5 0,15 0,09 6 0, 0,11 7 0,03 0,09 8-0,14 0,06 9 0,0 0, ,15 0,10 55

256 7 TESTES DE INDEPENDÊNCIA ( χ )

Engenharia da Qualidade

Engenharia da Qualidade Engenharia da Qualidade Pedro Paulo Balestrassi UNIFEI-Universidade Federal de Itajubá IEPG www.pedro.unifei.edu.br ppbalestrassi@gmail.com 35-36291161 88776958 Pensar estatisticamente será um dia, para

Leia mais

4-Teste de Hipóteses. Teste de Hipóteses

4-Teste de Hipóteses. Teste de Hipóteses Teste de Procedimentos Gerais Teste de média Z para 1 amostra Teste de média t para 1 amostra Teste de variância para 2 amostras A Distribuição de Fisher Teste de média t para 2 amostras Teste de média

Leia mais

Estatística Aplicada. CESE Métodos Computacionais. Pedro Paulo Balestrassi

Estatística Aplicada. CESE Métodos Computacionais. Pedro Paulo Balestrassi CESE Métodos Computacionais Estatística Aplicada Pedro Paulo Balestrassi UNIFEI-Universidade Federal de Itajubá www.pedro.unifei.edu.br ppbalestrassi@gmail.com 35-88776958 Pensar estatisticamente será

Leia mais

Curso de Estatística Aplicada

Curso de Estatística Aplicada Curso de Estatística Aplicada Pedro Paulo Balestrassi UNIFEI-Universidade Federal de Itajubá IEPG www.pedro.unifei.edu.br ppbalestrassi@gmail.com 35-36291161 88776958 Pensar estatisticamente será um dia,

Leia mais

Teste de Hipóteses (ou Teste de Significância)

Teste de Hipóteses (ou Teste de Significância) Teste de Hipóteses (ou Teste de Significância) Pedro Paulo Balestrassi www.pedro.unifei.edu.br ppbalestrassi@gmail.com 35-36291161 / 88776958 (cel) 1 São diferenças estatisticamente significantes? A B

Leia mais

Inferência Estatística Estimação de Parâmetros

Inferência Estatística Estimação de Parâmetros Inferência Estatística Estimação de Parâmetros Pedro Paulo Balestrassi www.pedro.unifei.edu.br ppbalestrassi@gmail.com 35-36291161 / 88776958 (cel) 1 Inferência Estatística: uma amostra ajudando a entender

Leia mais

Técnicas Computacionais em Probabilidade e Estatística I. Aula I

Técnicas Computacionais em Probabilidade e Estatística I. Aula I Técnicas Computacionais em Probabilidade e Estatística I Aula I Chang Chiann MAE 5704- IME/USP 1º Sem/2008 1 Análise de Um conjunto de dados objetivo: tratamento de um conjunto de dados. uma amostra de

Leia mais

Testes de Hipóteses. Ricardo Ehlers Departamento de Matemática Aplicada e Estatística Universidade de São Paulo

Testes de Hipóteses. Ricardo Ehlers Departamento de Matemática Aplicada e Estatística Universidade de São Paulo Testes de Hipóteses Ricardo Ehlers ehlers@icmc.usp.br Departamento de Matemática Aplicada e Estatística Universidade de São Paulo Introdução e notação Em geral, intervalos de confiança são a forma mais

Leia mais

6. NOÇÕES DE INFERÊNCIA ESTATÍSTICA

6. NOÇÕES DE INFERÊNCIA ESTATÍSTICA 6. NOÇÕES DE INFERÊNCIA ESTATÍSTICA 214 Problemas de inferência Inferir significa fazer afirmações sobre algo desconhecido. A inferência estatística tem como objetivo fazer afirmações sobre uma característica

Leia mais

6. NOÇÕES DE INFERÊNCIA ESTATÍSTICA

6. NOÇÕES DE INFERÊNCIA ESTATÍSTICA 6. NOÇÕES DE INFERÊNCIA ESTATÍSTICA 2019 Problemas de inferência Inferir significa fazer afirmações sobre algo desconhecido. A inferência estatística tem como objetivo fazer afirmações sobre uma característica

Leia mais

Probabilidade e Estatística

Probabilidade e Estatística Probabilidade e Estatística Aula 6 Distribuições Contínuas (Parte 02) Leitura obrigatória: Devore, Capítulo 4 Chap 6-1 Distribuições de Probabilidade Distribuições de Probabilidade Distribuições de Probabilidade

Leia mais

1 Que é Estatística?, 1. 2 Séries Estatísticas, 9. 3 Medidas Descritivas, 27

1 Que é Estatística?, 1. 2 Séries Estatísticas, 9. 3 Medidas Descritivas, 27 Prefácio, xiii 1 Que é Estatística?, 1 1.1 Introdução, 1 1.2 Desenvolvimento da estatística, 1 1.2.1 Estatística descritiva, 2 1.2.2 Estatística inferencial, 2 1.3 Sobre os softwares estatísticos, 2 1.4

Leia mais

Distribuições de Probabilidade. Frases. Roteiro

Distribuições de Probabilidade. Frases. Roteiro Distribuições de robabilidade Frases Uma probabilidade razoável é a única certeza Samuel Howe A experiência não permite nunca atingir a certeza absoluta. Não devemos procurar obter mais que uma probabilidade.

Leia mais

Estatística descritiva

Estatística descritiva Estatística descritiva Para que serve a estatística? Qual o seu principal objectivo? obter conclusões sobre a população usando uma amostra? População Amostragem Amostra Uma ou mais variáveis (X) são observadas

Leia mais

LEEC Probabilidades e Estatística 1 a Chamada 13/06/2005. Parte Prática C (C) M 1% 9% 10% (M) 4% 86% 90% 5% 95% 100%

LEEC Probabilidades e Estatística 1 a Chamada 13/06/2005. Parte Prática C (C) M 1% 9% 10% (M) 4% 86% 90% 5% 95% 100% . Definição dos acontecimentos: M T-shirt tem manchas C T-shirt tem costuras defeituosas D T-shirt é defeituosa A Preço da t-shirt é alterado a) PM) = % PC) = 5% PM C) = % LEEC Probabilidades e Estatística

Leia mais

Avaliação de Desempenho de Sistemas Discretos

Avaliação de Desempenho de Sistemas Discretos Avaliação de Desempenho de Sistemas Discretos Probabilidade Professor: Reinaldo Gomes reinaldo@dsc.ufcg.edu.br Planejamento Experimental 2 fatores manipuláveis x 1 x 2 x p entradas Processo...... saídas

Leia mais

Razão para rejeitar H 0

Razão para rejeitar H 0 Processo do teste de hipótese Hipótese de pesquisa: a idade média da população é 5 H : μ = 5 H 1 : μ 5 É X = improvável se μ =5? População Selecionar amostra aleatória Sim: Rejeite Ho Para definir pouco

Leia mais

1. ANÁLISE EXPLORATÓRIA E ESTATÍSTICA DESCRITIVA

1. ANÁLISE EXPLORATÓRIA E ESTATÍSTICA DESCRITIVA 1. ANÁLISE EXPLORATÓRIA E ESTATÍSTICA DESCRITIVA 2019 Estatística Descritiva e Análise Exploratória Etapas iniciais. Utilizadas para descrever e resumir os dados. A disponibilidade de uma grande quantidade

Leia mais

EXEMPLOS DE CÁLCULO DO TAMANHO AMOSTRAL. Desenvolvido por Lucas Lima Ayres

EXEMPLOS DE CÁLCULO DO TAMANHO AMOSTRAL. Desenvolvido por Lucas Lima Ayres EXEMPLOS DE CÁLCULO DO TAMANHO AMOSTRAL Desenvolvido por Lucas Lima Ayres Belo Horizonte/2015 1 1. INTERVALOS DE CONFIANÇA PARA UMA PROPORÇÃO 1.1. ASSINTÓTICO 1.1.1. ASSINTÓTICO SIMPLES 1.1.1.1.BILATERAL

Leia mais

Revisão de distribuições de probabilidades contínuas (Capítulo 6 Levine)

Revisão de distribuições de probabilidades contínuas (Capítulo 6 Levine) Revisão de distribuições de probabilidades contínuas (Capítulo 6 Levine) Statistics for Managers Using Microsoft Excel, 5e 2008 Pearson Prentice-Hall, Inc. Chap 6-1 Objetivos: Neste capítulo, você aprenderá:

Leia mais

Testes de Hipóteses. Ricardo Ehlers Departamento de Matemática Aplicada e Estatística Universidade de São Paulo

Testes de Hipóteses. Ricardo Ehlers Departamento de Matemática Aplicada e Estatística Universidade de São Paulo Testes de Hipóteses Ricardo Ehlers ehlers@icmc.usp.br Departamento de Matemática Aplicada e Estatística Universidade de São Paulo Introdução e notação Em geral, intervalos de confiança são a forma mais

Leia mais

Teste de hipóteses. Testes de Hipóteses. Valor de p ou P-valor. Lógica dos testes de hipótese. Valor de p 31/08/2016 VPS126

Teste de hipóteses. Testes de Hipóteses. Valor de p ou P-valor. Lógica dos testes de hipótese. Valor de p 31/08/2016 VPS126 3/8/26 Teste de hipóteses Testes de Hipóteses VPS26 Ferramenta estatística para auxiliar no acúmulo de evidências sobre uma questão Média de glicemia de um grupo de animais é diferente do esperado? Qual

Leia mais

Coleta e Modelagem dos Dados de Entrada

Coleta e Modelagem dos Dados de Entrada Coleta e Modelagem dos Dados de Entrada Capítulo 2 Páginas 24-52 Este material é disponibilizado para uso exclusivo de docentes que adotam o livro Modelagem e Simulação de Eventos Discretos em suas disciplinas.

Leia mais

AULA 11 Teste de Hipótese

AULA 11 Teste de Hipótese 1 AULA 11 Teste de Hipótese Ernesto F. L. Amaral 20 de setembro de 2012 Metodologia de Pesquisa (DCP 854B) Fonte: Triola, Mario F. 2008. Introdução à estatística. 10 ª ed. Rio de Janeiro: LTC. Capítulo

Leia mais

Distribuições Discretas de Probabilidade

Distribuições Discretas de Probabilidade Distribuições Discretas de Probabilidade Pedro Paulo Balestrassi www.pedro.unifei.edu.br ppbalestrassi@gmail.com 35-3696 / 88776958 (cel) O que é um experimento Aleatório? Um experimento que pode resultar

Leia mais

4ª LISTA DE EXERCÍCIOS - LOB1012. Variáveis Aleatórias Contínuas, Aproximações e TLC

4ª LISTA DE EXERCÍCIOS - LOB1012. Variáveis Aleatórias Contínuas, Aproximações e TLC 4ª LISTA DE EXERCÍCIOS - LOB1012 Variáveis Aleatórias Contínuas, Aproximações e TLC Assunto: Função Densidade de Probabilidade Prof. Mariana Pereira de Melo 1. Suponha que f(x) = x/8 para 3

Leia mais

Coleta e Modelagem dos Dados de Entrada

Coleta e Modelagem dos Dados de Entrada Slide 1 Módulo 02 Coleta e Modelagem dos Dados de Entrada Prof. Afonso C. Medina Prof. Leonardo Chwif Três Etapas Coleta Tratamento Inferência Coleta dos Dados 1. Escolha adequada da variável de estudo

Leia mais

PODER DO TESTE. Poder do Teste e Tamanho de Amostra para Testes de Hipóteses

PODER DO TESTE. Poder do Teste e Tamanho de Amostra para Testes de Hipóteses PODER DO TESTE Poder do Teste e Tamanho de Amostra para Testes de Hipóteses 1 2 Tipos de erro num teste estatístico Realidade (desconhecida) Decisão do teste aceita H 0 rejeita H 0 H 0 verdadeira decisão

Leia mais

7 Teste de Hipóteses

7 Teste de Hipóteses 7 Teste de Hipóteses 7-1 Aspectos Gerais 7-2 Fundamentos do Teste de Hipóteses 7-3 Teste de uma Afirmação sobre a Média: Grandes Amostras 7-4 Teste de uma Afirmação sobre a Média : Pequenas Amostras 7-5

Leia mais

Definição. Os valores assumidos pelos estimadores denomina-se estimativas pontuais ou simplesmente estimativas.

Definição. Os valores assumidos pelos estimadores denomina-se estimativas pontuais ou simplesmente estimativas. 1. Inferência Estatística Inferência Estatística é o uso da informção (ou experiência ou história) para a redução da incerteza sobre o objeto em estudo. A informação pode ou não ser proveniente de um experimento

Leia mais

Teste de Hipóteses Paramétricos

Teste de Hipóteses Paramétricos Teste de Hipóteses Paramétricos Fundamentos de um teste de hipóteses Como construir testes de hipóteses para uma média. Como construir testes de hipóteses para uma proporção. Como construir testes de hipóteses

Leia mais

Probabilidade e Estatística. Estimação de Parâmetros Intervalo de Confiança

Probabilidade e Estatística. Estimação de Parâmetros Intervalo de Confiança Probabilidade e Estatística Prof. Dr. Narciso Gonçalves da Silva http://páginapessoal.utfpr.edu.br/ngsilva Estimação de Parâmetros Intervalo de Confiança Introdução A inferência estatística é o processo

Leia mais

SUMÁRIO. 1.1 Introdução, Conceitos Fundamentais, 2

SUMÁRIO. 1.1 Introdução, Conceitos Fundamentais, 2 SUMÁRIO 1 CONCEITOS BÁSICOS, 1 1.1 Introdução, 1 1.2 Conceitos Fundamentais, 2 1.2.1 Objetivo, 2 1.2.2 População e amostra, 2 1.3 Processos estatísticos de abordagem, 2 1.4 Dados estatísticos, 3 1.5 Estatística

Leia mais

Estatística 1. Resumo Teórico

Estatística 1. Resumo Teórico Estatística 1 Resumo Teórico Conceitos do Curso 1. Tipos de Variáveis e Representações Gráficas a. Tipos de Variáveis b. Distribuição de Frequências c. Histograma 2. Estatística Descritiva Medidas Estatísticas

Leia mais

MOQ 13 PROBABILIDADE E ESTATÍSTICA. Professor: Rodrigo A. Scarpel

MOQ 13 PROBABILIDADE E ESTATÍSTICA. Professor: Rodrigo A. Scarpel MOQ 3 PROBABILIDADE E ESTATÍSTICA Professor: Rodrigo A. Scarpel rodrigo@ita.br www.mec.ita.br/~rodrigo Programa do curso: Semanas 2 3 4 5 6 7 8 9 0 2 3 4 5 e 6 Introdução à probabilidade (eventos, espaço

Leia mais

MOQ-13 PROBABILIDADE E ESTATÍSTICA. Professor: Rodrigo A. Scarpel

MOQ-13 PROBABILIDADE E ESTATÍSTICA. Professor: Rodrigo A. Scarpel MOQ-13 PROBABILIDADE E ESTATÍSTICA Professor: Rodrigo A. Scarpel rodrigo@ita.br www.mec.ita.br/~rodrigo Programa do curso: Semanas 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 e 16 Introdução à probabilidade (eventos,

Leia mais

Sumário. CAPÍTULO 1 Conceitos preliminares 1. CAPÍTULO 2 Descrição de dados: análise monovariada 47

Sumário. CAPÍTULO 1 Conceitos preliminares 1. CAPÍTULO 2 Descrição de dados: análise monovariada 47 CAPÍTULO 1 Conceitos preliminares 1 Introdução........................................................1 O que é estatística?.................................................. 4 Papel dos microcomputadores.........................................

Leia mais

6. NOÇÕES DE INFERÊNCIA ESTATÍSTICA

6. NOÇÕES DE INFERÊNCIA ESTATÍSTICA 6. NOÇÕES DE INFERÊNCIA ESTATÍSTICA 21 Problemas de inferência Inferir significa fazer afirmações sobre algo desconhecido. A inferência estatística tem como objetivo fazer afirmações sobre uma característica

Leia mais

UM ESTUDO DO ERRO TIPO II EM UM TESTE DE HIPÓTESES PARA A MÉDIA

UM ESTUDO DO ERRO TIPO II EM UM TESTE DE HIPÓTESES PARA A MÉDIA UM ESTUDO DO ERRO TIPO II EM UM TESTE DE HIPÓTESES PARA A MÉDIA CARRASCO, Cleber Giugioli 1 SILVA, Luciano Amaral da 2 7 Recebido em: 2013-04-29 Aprovado em: 2013-09-29 ISSUE DOI: 10.3738/1982.2278.894

Leia mais

Probabilidade e Estatística. stica. Prof. Dr. Narciso Gonçalves da Silva pessoal.utfpr.edu.

Probabilidade e Estatística. stica. Prof. Dr. Narciso Gonçalves da Silva  pessoal.utfpr.edu. Probabilidade e Estatística stica Prof. Dr. Narciso Gonçalves da Silva http://paginapessoal.utfpr.edu.br/ngsilva pessoal.utfpr.edu.br/ngsilva Distribuição Uniforme Uma variável aleatória contínua X está

Leia mais

Eng a. Morgana Pizzolato, Dr a. Aula 02 Revisão de Estatística DPS1037 SISTEMAS DA QUALIDADE II ENGENHARIA DE PRODUÇÃO CT/UFSM

Eng a. Morgana Pizzolato, Dr a. Aula 02 Revisão de Estatística DPS1037 SISTEMAS DA QUALIDADE II ENGENHARIA DE PRODUÇÃO CT/UFSM Eng a. Morgana Pizzolato, Dr a. Aula 02 Revisão de Estatística DPS1037 SISTEMAS DA QUALIDADE II ENGENHARIA DE PRODUÇÃO CT/UFSM TÓPICOS DESTA AULA Revisão de Estatística Coleta de dados Análise de dados

Leia mais

Métodos Quantitativos

Métodos Quantitativos Métodos Quantitativos Unidade 3 Estatística inferencial parte I Prof. Me. Diego Fernandes 1 Sumário Seção Slides 3.1 Noções de probabilidade 03 21 3.2 Distribuição dos estimadores 22 41 3.3 e 3.4 - Testes

Leia mais

Fernando de Pol Mayer

Fernando de Pol Mayer Fernando de Pol Mayer Laboratório de Estatística e Geoinformação (LEG) Departamento de Estatística (DEST) Universidade Federal do Paraná (UFPR) Este conteúdo está disponível por meio da Licença Creative

Leia mais

Engenharia da Qualidade. Profa. Luciana Rosa Leite

Engenharia da Qualidade. Profa. Luciana Rosa Leite Engenharia da Qualidade Profa. Luciana Rosa Leite Unidade 1 Introdução à Engenharia Da Qualidade 1.1 Evolução da Gestão da Qualidade 1.2 Revisão de conceitos estatísticos Exercícios Evolução da Gestão

Leia mais

Inferência. 1 Estimativa pontual de uma média 2 Estimativa intervalar de uma média. Renata Souza

Inferência. 1 Estimativa pontual de uma média 2 Estimativa intervalar de uma média. Renata Souza Inferência 1 Estimativa pontual de uma média 2 Estimativa intervalar de uma média Renata Souza Aspectos Gerais A estatística descritiva tem por objetivo resumir ou descrever características importantes

Leia mais

Testes de Hipóteses Paramétricos

Testes de Hipóteses Paramétricos Testes de Hipóteses Paramétricos Carla Henriques Departamento de Matemática Escola Superior de Tecnologia de Viseu Introdução Exemplos Testar se mais de metade da população irá consumir um novo produto

Leia mais

AULA 03 Estimativas e tamanhos amostrais

AULA 03 Estimativas e tamanhos amostrais 1 AULA 03 Estimativas e tamanhos amostrais Ernesto F. L. Amaral 03 de outubro de 2013 Centro de Pesquisas Quantitativas em Ciências Sociais (CPEQS) Faculdade de Filosofia e Ciências Humanas (FAFICH) Universidade

Leia mais

Distribuições Contínuas de Probabilidade

Distribuições Contínuas de Probabilidade Distribuições Contínuas de Probabilidade Uma variável aleatória contínua é uma função definida sobre o espaço amostral, que associa valores em um intervalo de números reais. Exemplos: Espessura de um item

Leia mais

Variáveis Aleatórias Contínuas e Distribuições de Probabilidade

Variáveis Aleatórias Contínuas e Distribuições de Probabilidade Variáveis Aleatórias Contínuas e Distribuições de Probabilidade Motivação A quantidade de oxigênio dissolvido é importante para aferir a qualidade de um regato. Os níveis aceitáveis de oxigênio variam

Leia mais

Capítulo 2. Distribuições de Probabilidade Estimativas de parâmetros e tempos-atéfalha. Flávio Fogliatto

Capítulo 2. Distribuições de Probabilidade Estimativas de parâmetros e tempos-atéfalha. Flávio Fogliatto Capítulo 2 Distribuições de Probabilidade Estimativas de parâmetros e tempos-atéfalha Flávio Fogliatto 1 Ajustes de distribuições Em estudos de confiabilidade, dados são amostrados a partir de uma população

Leia mais

Probabilidade e Estatística

Probabilidade e Estatística Probabilidade e Estatística Aula 7: Intervalos de Confiança com uma amostra Leitura obrigatória: Devore, cap 7 ou Montgomery e Runger, cap 8 Chap 8-1 Objetivos Como inferir sobre um parâmetro da população,

Leia mais

ENGENHARIA DA QUALIDADE A ENG AULA 2 REVISÃO DE ESTATÍSTICA

ENGENHARIA DA QUALIDADE A ENG AULA 2 REVISÃO DE ESTATÍSTICA ENGENHARIA DA QUALIDADE A ENG 09008 AULA REVISÃO DE ESTATÍSTICA PROFESSORES: CARLA SCHWENGBER TEN CATEN ROGÉRIO FEROLDI MIORANDO Introdução Em um ambiente industrial, os dados devem formar a base para

Leia mais

Estatística I Aula 8. Prof.: Patricia Maria Bortolon, D. Sc.

Estatística I Aula 8. Prof.: Patricia Maria Bortolon, D. Sc. Estatística I Aula 8 Prof.: Patricia Maria Bortolon, D. Sc. MODELOS PROBABILÍSTICOS MAIS COMUNS VARIÁVEIS ALEATÓRIAS CONTÍNUAS Lembram o que vimos sobre V.A. contínua na Aula 6? Definição: uma variável

Leia mais

AULA 05 Teste de Hipótese

AULA 05 Teste de Hipótese 1 AULA 05 Teste de Hipótese Ernesto F. L. Amaral 03 de setembro de 2012 Faculdade de Filosofia e Ciências Humanas (FAFICH) Universidade Federal de Minas Gerais (UFMG) Fonte: Triola, Mario F. 2008. Introdução

Leia mais

Testes de Hipóteses Paramétricos

Testes de Hipóteses Paramétricos Testes de Hipóteses Paramétricos Departamento de Matemática Escola Superior de Tecnologia de Viseu (DepMAT ESTV) Testes de Hipóteses Paramétricos 1 / 41 Introdução. Hipóteses Estatísticas. Erro Tipo I

Leia mais

MÉTODOS QUANTITATIVOS APLICADOS. Prof. Danilo Monte-Mor

MÉTODOS QUANTITATIVOS APLICADOS. Prof. Danilo Monte-Mor MÉTODOS QUANTITATIVOS APLICADOS Prof. Danilo Monte-Mor Métodos Quantitativos Aulas 1 e 2 Análise Exploratória de Dados 2 Danilo Soares Monte Mor Currículum Vitae Prof. Dr. e especialista em Métodos Quantitativos

Leia mais

DISTRIBUIÇÃO AMOSTRAL E ESTIMAÇÃO PONTUAL INTRODUÇÃO ROTEIRO POPULAÇÃO E AMOSTRA. Estatística Aplicada à Engenharia

DISTRIBUIÇÃO AMOSTRAL E ESTIMAÇÃO PONTUAL INTRODUÇÃO ROTEIRO POPULAÇÃO E AMOSTRA. Estatística Aplicada à Engenharia ROTEIRO 1. Introdução; DISTRIBUIÇÃO AMOSTRAL E ESTIMAÇÃO PONTUAL. Teorema Central do Limite; 3. Conceitos de estimação pontual; 4. Métodos de estimação pontual; 5. Referências. 1 POPULAÇÃO E AMOSTRA População:

Leia mais

CE219 - Controle Estatístico de Qualidade

CE219 - Controle Estatístico de Qualidade CE219 - Controle Estatístico de Qualidade Cesar Augusto Taconeli 30 de maio, 2017 Cesar Augusto Taconeli CE219 - Controle Estatístico de Qualidade 30 de maio, 2017 1 / 96 Aula 2 - Métodos estáticos para

Leia mais

PCM01. Curso de Estatística Aplicada. Pedro Paulo Balestrassi. www.pedro.unifei.edu.br ppbalestrassi@gmail.com 35-36291161 / 88776958 (cel)

PCM01. Curso de Estatística Aplicada. Pedro Paulo Balestrassi. www.pedro.unifei.edu.br ppbalestrassi@gmail.com 35-36291161 / 88776958 (cel) PCM01 Curso de Estatística Aplicada Pedro Paulo Balestrassi www.pedro.unifei.edu.br ppbalestrassi@gmail.com 35-36291161 / 88776958 (cel) 1 Pensar estatisticamente será um dia, para a eficiente prática

Leia mais

Modelos de Distribuição PARA COMPUTAÇÃO

Modelos de Distribuição PARA COMPUTAÇÃO Modelos de Distribuição MONITORIA DE ESTATÍSTICA E PROBABILIDADE PARA COMPUTAÇÃO Distribuições Discretas Bernoulli Binomial Geométrica Hipergeométrica Poisson ESTATÍSTICA E PROBABILIDADE PARA COMPUTAÇÃO

Leia mais

ALGUMAS DISTRIBUIÇÕES CONTÍNUAS DE PROBABILIDADE

ALGUMAS DISTRIBUIÇÕES CONTÍNUAS DE PROBABILIDADE ALGUMAS DISTRIBUIÇÕES CONTÍNUAS DE PROBABILIDADE 4. 1 INTRODUÇÃO Serão apresentadas aqui algumas distribuições de probabilidade associadas a v.a. s contínuas. A mais importante delas é a distribuição Normal

Leia mais

AULA 04 Teste de hipótese

AULA 04 Teste de hipótese 1 AULA 04 Teste de hipótese Ernesto F. L. Amaral 03 de outubro de 2013 Centro de Pesquisas Quantitativas em Ciências Sociais (CPEQS) Faculdade de Filosofia e Ciências Humanas (FAFICH) Universidade Federal

Leia mais

Inferência. 1 Estimativa pontual de uma média 2 Estimativa intervalar de uma média. Renata Souza

Inferência. 1 Estimativa pontual de uma média 2 Estimativa intervalar de uma média. Renata Souza Inferência 1 Estimativa pontual de uma média 2 Estimativa intervalar de uma média Renata Souza Aspectos Gerais A estatística descritiva tem por objetivo resumir ou descrever características importantes

Leia mais

Modelagem e Avaliação de Desempenho. Pós Graduação em Engenharia Elétrica - PPGEE Prof. Carlos Marcelo Pedroso 2018

Modelagem e Avaliação de Desempenho. Pós Graduação em Engenharia Elétrica - PPGEE Prof. Carlos Marcelo Pedroso 2018 Modelagem e Avaliação de Desempenho Pós Graduação em Engenharia Elétrica - PPGEE Prof. Carlos Marcelo Pedroso 2018 Análise de desempenho São disponíveis duas abordagens para realizar a análise de desempenho:

Leia mais

Distribuições de Probabilidade

Distribuições de Probabilidade Distribuições de Probabilidade Pedro Paulo Balestrassi www.iem.efei.br/pedro 35-3629-1161 1 Conceito Complete a tabela: A freqüência relativa f i =n i /n comumente é associada à probabilidade. Espaço Amostral

Leia mais

Identificação da Distribuição Teórica de Probabilidades

Identificação da Distribuição Teórica de Probabilidades Identificação da Distribuição Teórica de Probabilidades A utilização de gráficos, tais como um histograma, são muito úteis para a identificação ou delineamento da distribuição teórica de probabilidades.

Leia mais

Prof. Fabrício Maciel Gomes Departamento de Engenharia Química Escola de Engenharia de Lorena EEL

Prof. Fabrício Maciel Gomes Departamento de Engenharia Química Escola de Engenharia de Lorena EEL Prof. Fabrício Maciel Gomes Departamento de Engenharia Química Escola de Engenharia de Lorena EEL Referências Bibliográficas Sistema de Avaliação Duas Provas teóricas Um Trabalho em Grupo MédiaFinal 0,4

Leia mais

Métodos. Inferência. Estatística. Descritiva. Teste de. Estimação

Métodos. Inferência. Estatística. Descritiva. Teste de. Estimação NOÇÕES DE TESTE DE HIPÓTESES (I) Teste de hipóteses para a proporção populacional Métodos Estatísticos Métodos Estatísticos Estatística Descritiva Inferência Estatística Estimação Teste de Hipóteses TESTE

Leia mais

Prof. a Dr. a Simone Daniela Sartorio de Medeiros. DTAiSeR-Ar

Prof. a Dr. a Simone Daniela Sartorio de Medeiros. DTAiSeR-Ar Teste de hipótese para a média de populações normais Prof. a Dr. a Simone Daniela Sartorio de Medeiros DTAiSeR-Ar Teste de hipóteses para média de populações normais Objetivo: avaliar afirmações sobre

Leia mais

TESTE DE HIPÓTESE. Introdução

TESTE DE HIPÓTESE. Introdução TESTE DE HIPÓTESE Introdução O teste de hipótese estatística objetiva decidir se uma afirmação sobre uma população, usualmente um parâmetro desta, é, ou não, apoiada pela evidência obtida dos dados amostrais.

Leia mais

Estatística Descritiva (I)

Estatística Descritiva (I) Estatística Descritiva (I) 1 O que é Estatística Origem relacionada com a coleta e construção de tabelas de dados para o governo. A situação evoluiu: a coleta de dados representa somente um dos aspectos

Leia mais

1 Distribuições Discretas de Probabilidade

1 Distribuições Discretas de Probabilidade 1 Distribuições Discretas de Probabilidade A distribuição discreta descreve quantidades aleatórias (dados de interesse) que podem assumir valores particulares e os valores são finitos. Por exemplo, uma

Leia mais

Probabilidade e Estatística

Probabilidade e Estatística Probabilidade e Estatística Aula 9 Fundamentos de Testes de Hipóteses Leitura: Devore, Capítulo 8 Chap 9-1 Objetivos Neste capítulo, vamos aprender: Os princípios básicos de testes de hipóteses Estabelecer

Leia mais

SUMÁRIO. Prefácio, Espaço amostrai, Definição de probabilidade, Probabilidades finitas dos espaços amostrais fin itos, 20

SUMÁRIO. Prefácio, Espaço amostrai, Definição de probabilidade, Probabilidades finitas dos espaços amostrais fin itos, 20 SUMÁRIO Prefácio, 1 3 1 CÁLCULO DAS PROBABILIDADES, 15 1.1 Introdução, 15 1.2 Caracterização de um experimento aleatório, 15 1.3 Espaço amostrai, 16 1.4 Evento, 17 1.5 Eventos mutuamente exclusivos, 17

Leia mais

PROVA DE ESTATÍSTICA SELEÇÃO MESTRADO/UFMG 2006

PROVA DE ESTATÍSTICA SELEÇÃO MESTRADO/UFMG 2006 Instruções para a prova: PROVA DE ESTATÍSTICA SELEÇÃO MESTRADO/UFMG 006 a) Cada questão respondida corretamente vale um ponto. b) Questões deixadas em branco valem zero pontos (neste caso marque todas

Leia mais

Exame Final de Métodos Estatísticos

Exame Final de Métodos Estatísticos Exame Final de Métodos Estatísticos Data: de Junho de 26 Duração: 3h. Nome: Curso: Declaro que desisto N. Mec. Regime: As cotações deste exame encontram-se na seguinte tabela. Responda às questões utilizando

Leia mais

Fernando Nogueira Simulação 1

Fernando Nogueira Simulação 1 Simulação a Eventos Discretos Fernando Nogueira Simulação Introdução Simulação não é uma técnica de otimização: estima-se medidas de performance de um sistema modelado. Modelos Contínuos X Modelos Discretos

Leia mais

Filho, não é um bicho: chama-se Estatística!

Filho, não é um bicho: chama-se Estatística! Paulo Jorge Silveira Ferreira Filho, não é um bicho: chama-se Estatística! Estatística aplicada uma abordagem prática FICHA TÉCNICA EDIÇÃO: Paulo Ferreira TÍTULO: Filho, não é um bicho: chama-se Estatística!

Leia mais

INTRODUÇÃO À INFERÊNCIA ESTATÍSTICA. Prof. Anderson Rodrigo da Silva

INTRODUÇÃO À INFERÊNCIA ESTATÍSTICA. Prof. Anderson Rodrigo da Silva INTRODUÇÃO À INFERÊNCIA ESTATÍSTICA Prof. Anderson Rodrigo da Silva anderson.silva@ifgoiano.edu.br Tipos de Pesquisa Censo: é o levantamento de toda população. Aqui não se faz inferência e sim uma descrição

Leia mais

PROCESSOS ESTOCÁSTICOS

PROCESSOS ESTOCÁSTICOS PROCESSOS ESTOCÁSTICOS PNV 2452 TRATAMENTO E ANÁLISE DE DADOS 2015 MOTIVAÇÃO PARA A ANÁLISE DE DADOS Data Summary Number of Data Points = 30000 Min Data Value = 0.00262 Max Data Value = 982 Sample Mean

Leia mais

NOÇÕES DE TESTE DE HIPÓTESES (I) Teste de hipóteses para a proporção populacional

NOÇÕES DE TESTE DE HIPÓTESES (I) Teste de hipóteses para a proporção populacional NOÇÕES DE TESTE DE HIPÓTESES (I) Teste de hipóteses para a proporção populacional Métodos Estatísticos Métodos Estatísticos Estatística Descritiva Inferência Estatística Estimação Teste de Hipóteses TESTE

Leia mais

Prof. Lorí Viali, Dr.

Prof. Lorí Viali, Dr. Prof. Lorí Viali, Dr. viali@mat.ufrgs.br http://www.mat.ufrgs.br/~viali/ Uma variável aleatória X tem uma distribuição normal se sua fdp for do tipo: f(x) 1.e 1 2. x µ σ 2, x R 2π. σ com - < µ < e σ >

Leia mais

5. PRINCIPAIS MODELOS CONTÍNUOS

5. PRINCIPAIS MODELOS CONTÍNUOS 5. PRINCIPAIS MODELOS CONTÍNUOS 2019 5.1. Modelo uniforme Uma v.a. contínua X tem distribuição uniforme com parâmetros e ( < ) se sua função densidade de probabilidade é dada por f ( x )={ 1 β α, α x β

Leia mais

Prof. Lorí Viali, Dr. Prof. Lorí Viali, Dr. PUCRS FAMAT: Departamento de Estatística

Prof. Lorí Viali, Dr.   Prof. Lorí Viali, Dr. PUCRS FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. viali@mat.ufrgs.br http://www.ufrgs.br/~viali/ Coleção de números n estatísticas sticas O número n de carros vendidos no país aumentou em 30%. A taxa de desemprego atinge, este mês,

Leia mais

Estimação e Testes de Hipóteses

Estimação e Testes de Hipóteses Estimação e Testes de Hipóteses 1 Estatísticas sticas e parâmetros Valores calculados por expressões matemáticas que resumem dados relativos a uma característica mensurável: Parâmetros: medidas numéricas

Leia mais

ANÁLISE DE RESULTADOS

ANÁLISE DE RESULTADOS ANÁLISE DE RESULTADOS Conteúdo 2 1. Planejamento de Experimentos 2. Introdução Medidas de Desempenho Análise Estatística dos Resultados Comparação de Resultados Procedimento para análise de resultados

Leia mais

Instituto Tecnológico de Aeronáutica Divisão de Engenharia Mecânica-Aeronáutica. Professora: Denise Beatriz T. P. do Areal Ferrari

Instituto Tecnológico de Aeronáutica Divisão de Engenharia Mecânica-Aeronáutica. Professora: Denise Beatriz T. P. do Areal Ferrari Instituto Tecnológico de Aeronáutica Divisão de Engenharia Mecânica-Aeronáutica Professora: Denise Beatriz T. P. do Areal Ferrari denise@ita.br Distribuições Discretas Uniforme Bernoulli Binomial Poisson

Leia mais

Tutorial para o desenvolvimento das Oficinas

Tutorial para o desenvolvimento das Oficinas Tutorial para o desenvolvimento das Oficinas 1 Métodos Quantitativos Profa. Msc. Regina Albanese Pose 2 Objetivos Objetivo Geral Este tutorial tem como objetivo parametrizar o desenvolvimento da oficina

Leia mais

Teste de % de defeituosos para 1 amostra

Teste de % de defeituosos para 1 amostra DOCUMENTO OFICIAL DO ASSISTENTE DO MINITAB Este documento é de uma série de papéis que explicam a pesquisa conduzida por estatísticos da Minitab para desenvolver os métodos e as verificações de dados usadas

Leia mais

Enrico A. Colosimo Depto. Estatística UFMG

Enrico A. Colosimo Depto. Estatística UFMG Bioestatística F Conceitos de Teste de Hipóteses Enrico A. Colosimo Depto. Estatística UFMG http://www.est.ufmg.br/~enricoc/ f(x).4.35.3.25.2.15.1.5 Tabela Normal Padronizada Distribuicao Gaussiana com

Leia mais

Introdução à Bioestatística Turma Nutrição

Introdução à Bioestatística Turma Nutrição Universidade Federal de Minas Gerais Instituto de Ciências Exatas Departamento de Estatística Introdução à Bioestatística Turma Nutrição Aula 8: Intervalos de Confiança para Média e Proporção Distribuição

Leia mais

MEDIDAS DE POSIÇÃO E DE DISPERSÃO. Profª Andréa H Dâmaso

MEDIDAS DE POSIÇÃO E DE DISPERSÃO. Profª Andréa H Dâmaso MEDIDAS DE POSIÇÃO E DE DISPERSÃO Profª Andréa H Dâmaso Bioestatística e Delineamento Experimental - 2012 Tópicos da aula Medidas de tendência central e dispersão Variáveis contínuas: distribuição normal

Leia mais

Capacidade de Processo Material Complementar

Capacidade de Processo Material Complementar Capacidade de Processo Material Complementar Exemplo Pistões Anéis de pistão para motores de automóveis produzidos por processo de forja Objetivo: Controle estatístico para diâmetro interno dos anéis por

Leia mais

Modelagem e Avaliação de Desempenho. Pós Graduação em Engenharia Elétrica - PPGEE Prof. Carlos Marcelo Pedroso 2017

Modelagem e Avaliação de Desempenho. Pós Graduação em Engenharia Elétrica - PPGEE Prof. Carlos Marcelo Pedroso 2017 Modelagem e Avaliação de Desempenho Pós Graduação em Engenharia Elétrica - PPGEE Prof. Carlos Marcelo Pedroso 2017 Análise de desempenho São disponíveis duas abordagens para realizar a análise de desempenho:

Leia mais

Apontamentos de Introdução às Probabilidades e à Estatística

Apontamentos de Introdução às Probabilidades e à Estatística i Índice 1. Introdução 1 1.1. Enquadramento e objectivos 2 1.2. Organização 5 1.3. Noções base da Estatística 7 1.3.1. Distinção entre população e amostra 8 1.3.2. Amostragem 10 1.3.3. Unidade estatística

Leia mais

Métodos Experimentais em Ciências Mecânicas

Métodos Experimentais em Ciências Mecânicas Métodos Experimentais em Ciências Mecânicas Professor Jorge Luiz A. Ferreira Pertencem ao grupo de ferramentas estatísticas que permitem caracterizar um conjunto de dados sob ponto de vista da tendência

Leia mais

Modelagem e Avaliação de Desempenho. Pós Graduação em Engenharia Elétrica - PPGEE Prof. Carlos Marcelo Pedroso 2014

Modelagem e Avaliação de Desempenho. Pós Graduação em Engenharia Elétrica - PPGEE Prof. Carlos Marcelo Pedroso 2014 Modelagem e Avaliação de Desempenho Pós Graduação em Engenharia Elétrica - PPGEE Prof. Carlos Marcelo Pedroso 2014 Análise de desempenho São disponíveis duas abordagens para realizar a análise de desempenho:

Leia mais