Trabalho de Análise de Dados Chemical Company

Tamanho: px
Começar a partir da página:

Download "Trabalho de Análise de Dados Chemical Company"

Transcrição

1 Trabalho de Análise de Dados - Relatório - Ana Rodrigues Andreia Silva Hermano Maia Mª Francisca Monteiro Gestão da Qualidade Total Prof.ª Maria Henriqueta Sampaio da Nóvoa Faculdade de Engenharia da Universidade do Porto Mestrado Integrado em Engenharia Industrial e Gestão dezembro de 2015

2

3 Resumo O presente trabalho visa delinear um conjunto de orientações que promovam a melhoria do processo de produção de uma empresa química a Chem, que tem apresentado problemas de desempenho. A análise tem por base uma amostra recolhida na última semana pelo engenheiro responsável, a qual reúne observações referentes a diversas variáveis do processo: perdas por hora, rotações por minuto (RPM), temperaturas das duas fases de produção (Temp1 e Temp2), fluxo de H2O, concentração do catalisador em dióxido de titânio (TiO2), linha de produção, operário, nível de vácuo e fornecedor ( supplier ). Principiando-se pela definição da variável dependente e malgrado o desconhecimento de detalhes sobre o processo em estudo, estabelece-se como objetivo a minimização da variável perdas por hora. A análise às restantes variáveis evidencia a concentração da variável TiO2 em gamas específicas de valores e a relação direta entre estas e a variável fornecedor, pelo que, face a tal redundância, a análise ulterior tem em conta apenas a primeira. Com recurso a análise gráfica (particularmente a gráficos boxplot) e a técnicas de inferência estatística como análise de variância (ANOVA) e testes de hipótese à diferença de valores esperados e à razão de variâncias, implementadas através do software Minitab 17, conclui-se que a concentração em dióxido de titânio é o principal fator estatisticamente significativo, sendo que menores concentrações deste composto químico conduzem a valores inferiores da variável de resposta perdas por hora. Recomenda-se, então, a utilização de catalisadores com baixa concentração em dióxido de titânio, o que, in casu, é equivalente a recomendar que a empresa privilegie o fornecedor Boopy. Finalmente, destaca-se a pertinência de algumas análises/ações adicionais enquanto potenciais trabalhos futuros: (i) recolha de nova amostra após implementação da recomendação referida para aferir da existência de outros fatores significativos, (ii) construção de cartas de controlo e análise da capacidade do processo, (iii) auscultação dos operários e (iv) recurso a software de simulação. i

4 Trabalho de Análise de Dados Abstract The current work tries to establish guidelines for the improvement of the production process at a chemical company Chem that has shown performance problems. Our analysis is based on a sample of observations of several process variables collected in the most recent week by the engineer in charge: losses per hour, rotations per minute (RPM), temperature of the two phases of production (Temp1 and Temp2), H2O flow, concentration of titanium dioxide (TiO2) at the catalyzer, production line, worker, level of vacuum and supplier. Starting with the definition of the dependent variable of the process, despite the ignorance of detail about the process, the goal is to minimize the variable losses per hour. The analysis of the other variables reveals the concentration of the variable TiO2 on specific ranges of values and a direct relation between these ranges and the variable supplier. Thus only the first variable is considered in the forthcoming analysis. A graphical analysis (particularly boxplot charts) and statistical inference techniques such as analysis of variance (ANOVA) and hypothesis tests on the difference of expected values and on the ratio of variances, performed with the Minitab 17 software show that the concentration of titanium dioxide is the main statistically significant explanatory factor, with lower levels of concentration resulting in lower levels of losses per hour. Therefore, we recommend that catalyzers with low levels of titanium dioxide concentration are used which, in this case, is equivalent to recommending that Chem prefers the supplier Boopy. Finally, we highlight the relevance of several additional analysis or actions for future work: (i) the analysis of a new sample after the implementation of our recommendation to check the existence of other relevant factors, (ii) building control charts and analyzing the capacity of the process, (iii) interviewing workers, and (iv) the use of simulation software. ii

5 Índice de conteúdos 1 Introdução Descrição e análise das variáveis Descrição das variáveis A variável dependente perda por hora As variáveis independentes e sua relação Análise da variável de resposta em função das variáveis de entrada Efeito das rotações por minuto Efeito do nível de concentração em dióxido de titânio Foco nos fatores estatisticamente significativos Conclusões e recomendações para a melhoria do processo Trabalhos futuros Bibliografia Anexos iii

6 Trabalho de Análise de Dados Índice de tabelas Tabela 1. Variáveis em análise... 2 Tabela 2. Resultados dos testes ANOVA para as variáveis potencialmente não significativas... 7 Tabela 3. Número de observações por par TiO 2 /RPM... 9 Tabela 4. Diferenças entre níveis de RPM para o mesmo nível de TiO 2 : resultados dos testes.. 10 Índice de figuras Figura 1. Análise da variável dependente "perda por hora"... 3 Figura 2. Dotplot para a variável TiO Figura 3. Histogramas para as variáveis Temp1 e Temp Figura 4. Gráficos de dispersão perda por hora vs Temp1, Temp2 e TiO Figura 5. Gráficos boxplot da variável perda por hora (agrupados de acordo com as variáveis independentes)... 6 Figura 6. Intervalos de Tukey (comparação por níveis de RPM)... 7 Figura 7. Intervalos de Tukey (comparação por níveis de TiO 2 )... 8 Figura 8. Boxplot da variável perda por hora (agrupado por TiO 2 e por RPM)... 9 Figura 9. Boxplot da perda por hora (baixa concentração em TiO 2, por fluxo de H 2 O) Figura 10. Boxplot da perda por hora (baixa concentração em TiO 2, por nível de vácuo) iv

7 1 Introdução O presente trabalho é desenvolvido no âmbito da unidade curricular de Gestão da Qualidade Total do 4.º ano do ciclo de estudos integrado conducente ao grau de Mestre em Engenharia Industrial e Gestão da Faculdade de Engenharia da Universidade do Porto e visa delinear um conjunto de orientações que promovam a melhoria do processo de produção de uma empresa química a Chem, que tem apresentado problemas de desempenho. Para alcançar tal objetivo, afigura-se essencial a compreensão das principais causas de preocupação. Assim, a análise basear-se-á nos dados recolhidos, durante a última semana, sobre as variáveis fundamentais do processo e na aplicação de diversas técnicas estatísticas através do software Minitab 17, da Minitab Inc.. Inicialmente, proceder-se-á à definição concreta das variáveis sob análise, nomeadamente à identificação do seu tipo e à avaliação da centragem e dispersão dos dados. Ulteriormente, será caracterizada a variável dependente e serão identificadas as variáveis independentes que apresentam impacto estatisticamente significativo na sua variação. Nesta fase, destaque-se a importância da construção e interpretação de gráficos boxplot e da técnica de inferência estatística ANOVA (análise de variância) a 1 fator. Finalmente, serão elencadas recomendações para a melhoria do processo de produção, sustentadas na análise supra referida, e avaliar-se-á a pertinência de análises adicionais enquanto potenciais trabalhos futuros. 1

8 Trabalho de Análise de Dados 2 Descrição e análise das variáveis 2.1 Descrição das variáveis A amostra recolhida é constituída por 100 observações, recolhidas pelo engenheiro responsável, apresentando-se, na Tabela 1, o tipo das variáveis em análise, bem como os valores tomados pelas mesmas (no caso de variáveis quantitativas contínuas são indicados o mínimo e o máximo). Tabela 1. Variáveis em análise Nome Tipo Observações Perda por hora Quantitativa contínua Entre 32,371 e 109,854 Rotações por minuto (RPM) Quantitativa discreta 25, 30, 35 ou Temperatura na 1.ª fase de produção (Temp1) Quantitativa contínua Entre 108,743 e 130,666 Temperatura na 2.ª fase de produção (Temp2) Quantitativa contínua Entre 126,844 e 168,452 Fluxo de H 2 O Quantitativa discreta 200, 250 ou 300 Concentração do catalisador (em dióxido de titânio) Quantitativa contínua Entre 3,43504 e 8,37346 Linha de Produção Qualitativa 1 5, 7, 9, 12 ou 15 Operário Qualitativa nominal Mike, Sam, Mary, Sue ou John Nível de vácuo Qualitativa ordinal N-None, L-Low, M-Medium ou H-High Fornecedor ( supplier ) Qualitativa nominal Boopy, Sloppy ou Grumpy A variável perda por hora, do tipo quantitativa contínua, corresponderá à variável dependente do processo, já que constitui uma medida de desempenho e o objetivo do presente trabalho é, precisamente, a melhoria da performance do processo. As restantes variáveis assumem-se como os inputs do processo químico. 2 1 Desconhecendo-se se a denominação da linha de produção teve por base algum método lógico que permita a ordenação das classes segundo um critério relevante (nomeadamente por ordem de disposição das linhas no espaço físico da empresa ou por ordem de antiguidade das linhas) optou-se por não classificar a variável como nominal ou ordinal.

9 2.2 A variável dependente perda por hora Para iniciar o estudo do comportamento da variável perda por hora, foram calculadas algumas medidas de localização e dispersão e construiu-se um histograma, que, em domínio contínuo, permite uma perceção global da distribuição dos dados. A média situa- -se em 70,159, ligeiramente inferior à mediana de 70,482. Por outro lado, o valor mínimo é 32,371 e o máximo é 109,854, resultando numa amplitude de 77,483. O desvio padrão é de 19,276. Análise da variável dependente 'perda por hora' Anderson-Darling Normality Test A-Squared 0, P-Value 0,117 Mean 70,159 StDev 19,276 Variance 371,559 Skewness 0, Kurtosis -0, N Minimum 32,371 1st Quartile 54,0 Median 70,482 3rd Quartile 83,635 Maximum 109,854 95% Confidence Interval for Mean 66,334 73,983 95% Confidence Interval for Median 62,711 76,742 95% Confidence Interval for StDev 16,924 22,392 95% Confidence Intervals Mean Median Figura 1. Análise da variável dependente "perda por hora" A distribuição dos dados sugere uma maior concentração na zona central, como é característico das distribuições Gaussianas, embora o coeficiente de assimetria (positivo de 0,111) aponte para uma distribuição assimétrica à direita. Não sendo o histograma da Figura 1 conclusivo, é pertinente a realização de um teste à normalidade. Optou-se pela formulação de Anderson-Darling, tendo-se obtido um valor de prova de 0,117 que é superior ao nível de significância adotado (5%), não havendo, então, evidências estatísticas que apoiem a rejeição da hipótese de normalidade. Relativamente à existência de outliers, os testes realizados sugerem a sua ausência, permitindo uma análise posterior mais conclusiva. 3

10 Trabalho de Análise de Dados 2.3 As variáveis independentes e sua relação Antes de partir para a análise da relação entre as variáveis independentes e a variável dependente, importa realizar uma análise a cada uma das variáveis independentes, particularmente daquelas que estão expressas em escala contínua: Temp1, Temp2 e TiO2. Nesse sentido, foram construídos dotplots e histogramas. No caso da variável TiO2, ou seja, da concentração do catalisador em dióxido de titânio, o dotplot (Figura 2) sugere que os valores recolhidos se concentram em três grupos: entre 3,4 e 4,4; entre 5,4 e 6,4 e entre 7,4 e 8,4. Foram, então, atribuídas, respetivamente, as categorias de baixa (L), média (M) e elevada (H) concentração. Dotplot para a variável TiO2 3,5 4,2 4,9 5,6 TiO2 6,3 7,0 7,7 8,4 Figura 2. Dotplot para a variável TiO2 Analisou-se, de seguida, a relação entre a variável supplier (que se assume ser o fornecedor do catalisador) e a variável TiO2. Todas as observações que registam baixa concentração em TiO2 têm como fornecedor o Boopy, todas as observações com média concentração em TiO2 têm como fornecedor o Sloppy e, finalmente, todas as observações com elevada concentração em TiO2 têm como fornecedor o Grumpy. Relativamente às variáveis Temp1 e Temp2, estas não parecem seguir a tendência de agrupamento em gamas específicas de valores como a variável TiO2, estando as observações, sobretudo para Temp2, concentradas na zona central. Temp1 apresenta uma média de 119,70 e um desvio padrão de 4,99, enquanto para Temp2 a média situa-se em 145,51 e o desvio padrão é de 7, Temp ,5 118,71 135,0 120,69 142,5 95% Confidence Interval for Median Figura 3. Histogramas para as variáveis Temp1 e Temp2 95% Confidence Intervals Anderson-Darling Normality Test A-Squared 0,61 P-Value 0,108 Mean 119,70 StDev 4,99 Variance 24,87 Skewness -0, Kurtosis -0, N 100 Minimum 108,74 1st Quartile 115,97 Median 120,26 3rd Quartile 122,79 Maximum 130,67 95% Confidence Interval for Mean 118,61 121,82 95% Confidence Interval for StDev 4,38 5,79 Temp2 MeanO teste à normalidade de Anderson-Darling Mean regista valores de prova de 0,108 e 0,692 para Temp1 e Temp2, respetivamente, o que não se opõe à hipótese de normalidade das Median Median suas distribuições. 119 Averiguou-se a eventual 122 relação 143 de Temp1 144 e 145 Temp2 entre 146 si e 147com as restantes variáveis independentes, contudo nenhuma se destacou. 150,0 95% Confidence Intervals 157,5 165,0 Anderson-Darling Normality Test A-Squared 0,26 P-Value 0,692 Mean 145,51 StDev 7,76 Variance,28 Skewness 0, Kurtosis 0, N 100 Minimum 126,84 1st Quartile 1,39 Median 145,18 3rd Quartile 150,43 Maximum 168,45 95% Confidence Interval for Mean 143,96 147,05 95% Confidence Interval for Median 143,29 147,32 95% Confidence Interval for StDev 6,82 9,02 4

11 3 Análise da variável de resposta em função das Regression variáveis for de entrada vs Temp1 Nesta secção, pretende-se identificar quais dos inputs do processo químico apresentam Fitted Line Plot for Linear Model um efeito estatisticamente significativo na variação da variável de Y = resposta 169,5-0,8296 (perdas X por hora), ou seja, visa-se a definição dos X s vitais. Principiou-se pela análise da relação 100 entre as 100 variáveis independentes quantitativas expressas em escala contínua (Temp1, Temp2 e TiO2) e variável de resposta através da construção de gráficos de dispersão e do cálculo do coeficiente de determinação amostral (r 2 ). Y: X: Temp1 Y: X: Temp1 Regression for vs Temp1 Model Selection Model ReportSelection Report Fitted Line Plot for Linear Model Y = 169,5-0,8296 X Large residual Y: X: Temp1 Y: X: Temp2 Y: X: TiO Regression for vs Temp1 Model Selection Report Fitted Line Plot for Linear Model Y = 169,5-0,8296 X Temp1 Fitted Line Plot for Linear Model Y = 108,5-0,2637 X 150 Temp2 125 Regression for vs Temp2 Model Selection Report Regression for vs TiO2 Model Selection Report Fitted Line Plot for Linear Model Y = 10, ,23 X 80 Y: 110 X: Temp2 Y: X: TiO2 3 1 Large residual Y: X: Temp2 R-squared (adjusted) R-squared (adjusted) 3,63% 3,63% 3,47% P-value, model P-value, model 0,032* 0,032* 0,067 P-value, 100 linear term P-value, linear term 0,032* 0,032* 0,392 P-value, quadratic term P-value, quadratic term 0,365 Residual standard deviation Residual standard deviation 18,922 18,922 18, Large residual Unusual Y: X X: TiO2 Fitted Line Plot for Fitted Linear Line Model Plot for Linear Model Y = 10, ,23 Selected Y = X 10,84 Model + 10,23 Selected Alternative X Model Large Model residua Alte Statistics 120 Statistics Linear Linear Quadratic R-squared (adjusted) R-squared (adjusted) 0,12% 0,12% 1,58% P-value, model P-value, model 0,293 0,293 0,172 P-value, 100 linear term P-value, linear term P-value, quadratic term P-value, quadratic term 0,293 0,293 0,131 0,121 Residual standard deviation Residual standard deviation 19,264 19,264 19, Statistics Large residual Regression for Regression vs Temp2 for vs Temp2 Model 115 Selection 120 Model ReportSelection Report Temp1 Temp1 Fitted Line Plot for Fitted Linear Line Model Plot for Linear Model Large residual Y = 108,5-0,2637 Y = X 108,5-0,2637 X Unusual X Selected Model Selected Alternative Model Model Alte Statistics Linear Linear Quadratic * Statistically significant * Statistically (p < 0,05) significant (p < 0,05) 130 Regression for Regression vs TiO2 for vs TiO Model Selection Model ReportSelection 1501 Report Temp2 Temp TiO2 7 6 TiO Statistics Statistics Selected Alternative Model Model Linear Quadratic R-squared (adjusted) R-squared (adjusted) 77,44% 77,44% 77,53% P-value, model P-value, model 0,000* 0,000* 0,000* P-value, linear term P-value, linear term 0,000* 0,000* 0,004* P-value, quadratic term P-value, quadratic term 0,2 Residual standard deviation Residual standard deviation 9,156 9,156 9,137 * Statistically significant * Statistically (p < 0,05) significant (p < 0,05) Selected Model Linear Alt TiO Statistics Figura 4. Gráficos de dispersão perda por hora vs Temp1, Temp2 e TiO2 Selected Model Linear Alternative Model Quadratic R-squared (adjusted) 77,44% 77,53% P-value, model 0,000* 0,000* P-value, linear term 0,000* 0,004* P-value, quadratic term 0,2 Residual standard deviation 9,156 9,137 * Statistically significant (p < 0,05) 5

12 Trabalho de Análise de Dados No caso das temperaturas de ambas as fases de produção, considerando os valores reduzidos de r 2 (3,63% para Temp1 e 0,12% para Temp2) e a considerável dispersão espelhada nos gráficos, parece inexistir relação destas variáveis com a variável de resposta. Relativamente à relação da concentração em dióxido de titânio com as perdas por hora, obteve-se um r 2 de 77,44%, sendo que o gráfico evidencia, como já referido anteriormente, a concentração da variável TiO2 em três gamas distintas de valores. As concentrações mais elevadas em dióxido de titânio registam um maior valor de perdas por hora, embora dentro de cada gama de valores se observe alguma dispersão. Para analisar a relação entre a variável perda por hora e as variáveis RPM, fluxo de H2O, concentração em TiO2 (baixa, média, elevada), linha de produção, operário e nível de vácuo procedeu-se, inicialmente, à construção de gráficos boxplot, como documenta a Figura 5. A exclusão da análise da variável supplier justifica-se pela sua relação direta com os níveis de concentração em TiO2 (a análise de ambas resultaria numa redundância). Boxplot da perda por hora (por RPM) Boxplot da perda por hora (por fluxo de H20) Boxplot da perda por hora (por TiO2) L M H RPM H2O flow TiO2 Boxplot da perda por hora (por linha) Boxplot da perda por hora (por operário) Boxplot da perda por hora (por vácuo) John Mary Mike Sam Sue H L M N Line Operator Vacuum 6 Figura 5. Gráficos boxplot da variável perda por hora (agrupados de acordo com as variáveis independentes) Da análise visual, resulta a perceção de que as variáveis RPM e nível de concentração em TiO2 terão impacto na variação da variável de resposta. No primeiro caso, o gráfico, embora sendo pouco conclusivo quando RPM é 25, sugere, para os restantes valores de RPM (30, 35 e ), que quanto mais elevado for o valor de rotações por minuto, mais perdas por hora o processo terá. Por outro lado, uma maior concentração em TiO2 aparenta implicar valores mais elevados da variável de resposta. Em sentido contrário, as variáveis fluxo de H2O, operário, nível de vácuo e linha de produção esta última com algumas reservas parecem não ter impacto significativo na variação da variável de resposta. Para confirmar a inexistência desse impacto, recorreu- -se a testes ANOVA (análise de variância), a 1 fator, para cada uma das quatro variáveis.

13 Os testes pressupuseram variâncias iguais 2 e seguiram a seguinte formulação: Hipótese nula (H 0 ): Os valores esperados das amostras são iguais. Hipótese alternativa (H 1 ): Pelo menos um valor esperado de uma amostra é diferente. O nível de significância adotado foi de 5%, indicando-se na Tabela 2 os resultados. Tabela 2. Resultados dos testes ANOVA para as variáveis potencialmente não significativas Variável Resultado P-Value H 2 O flow Não rejeitar H0. 0,623 Operário Não rejeitar H0. 0,971 Vácuo Não rejeitar H0. 0,573 Linha Não rejeitar H0. 0,177 Como expectável, os resultados dos quatro testes apontam para a não rejeição da hipótese nula, ou seja, as variáveis testadas não têm efeito significativo na variação das perdas por hora. 3.1 Efeito das rotações por minuto A análise gráfica sugeriu a possibilidade da variável RPM ter efeito significativo na variação da variável de resposta. Aplicou-se, então, um teste ANOVA, a 1 fator, com formulação idêntica aos testes anteriores e construíram-se intervalos de confiança de Tukey, a 95%. O resultado do teste ANOVA é de rejeição da hipótese nula, com um valor de prova de 0,000, pelo que existem evidências estatísticas de que as rotações por minuto apresentam um impacto significativo no valor das perdas por hora. Figura 6. Intervalos de Tukey (comparação por níveis de RPM) 2 No caso específico do agrupamento por linha de produção das observações das perdas por hora, a aplicação, baseada na normalidade da distribuição, do teste de Bartlett (teste bilateral com hipótese nula assente na igualdade de todas as variâncias) apresenta como resultado a rejeição da hipótese nula, com um valor de prova de 0,004, pelo que, aquando do teste ANOVA, não se deveria assumir a igualdade de variâncias. Contudo, por simplificação da análise, ignorou-se o resultado do teste de Bartlett. 7

14 Trabalho de Análise de Dados Rejeitada a hipótese nula, a construção de intervalos de confiança de Tukey é relevante para concluir quais os valores esperados que são significativamente diferentes uns dos outros. Os intervalos para as diferenças -35, -30 e -25, não contêm o valor zero, incluindo apenas valores positivos, pelo que se infere que dos quatro níveis estudados para a variável RPM, o nível é aquele que apresenta piores resultados, na medida em que potencia um valor superior da variável perdas por hora. A diferença dos valores esperados para níveis de RPM de 35 e 30 é também significativa, sendo preferível o nível 30, pois o mesmo possibilita um valor menor de perdas por hora. Embora não se observem (com α=5%) diferenças significativas entre os valores esperados e 30-25, existem indícios, tendo em conta a representação gráfica dos intervalos, que podem suportar a preferência do nível 25 em detrimento do nível 35 e do nível 30 em detrimento do nível Efeito do nível de concentração em dióxido de titânio Seguindo igual procedimento ao adotado na análise do efeito das rotações por minuto, a aplicação do teste ANOVA teve como resultado a rejeição da hipótese nula, com um valor de prova de 0,000. Assim, existem evidências estatísticas de que o efeito do nível de concentração em dióxido de carbono é significativo. Importa, então, analisar os intervalos de confiança de Tukey, de forma a identificar qual o nível de concentração que minimiza as perdas do processo. Figura 7. Intervalos de Tukey (comparação por níveis de TiO2) As três diferenças de valores esperados estudadas são significativas, sendo possível concluir que níveis superiores de concentração em dióxido de titânio implicam perdas superiores. Será então de preferir a utilização de catalisadores com baixos níveis de TiO2, ou seja, deve privilegiar-se o fornecedor Boopy e evitar-se o fornecedor Grumpy. 8

15 3.3 Foco nos fatores estatisticamente significativos Tendo em conta que a análise e testes realizados indicam que as variáveis independentes RPM e TiO2 são estatisticamente significativas no que concerne à variação da variável dependente perda por hora, é relevante proceder a uma análise combinada daquelas variáveis, ou seja, agrupar as observações por par TiO2/RPM. Começou-se, então, pela construção do boxplot da Figura Boxplot da perda por hora (por TiO2 e por RPM) RPM TiO L M H Figura 8. Boxplot da variável perda por hora (agrupado por TiO2 e por RPM) Como se percebe da Figura 8, existem alguns pares TiO2/RPM para os quais não se registam observações e outros em que essas observações não são suficientes para construir um boxplot completo. A Tabela 3 indica o número de observações para cada par. Tabela 3. Número de observações por par TiO2/RPM RPM TiO Total Baixa (L) Média (M) Elevada (H) Total Além do evidente desequilíbrio no número de observações para cada par, nota-se, desde logo, que as observações com RPM estão sobretudo associadas a níveis elevados de dióxido de titânio, enquanto as observações com 30 RPM têm associado um nível baixo de dióxido de titânio. Ignorando os pares para os quais o número de observações é igual ou inferior a 2, prossegue-se a análise com a realização de testes de hipótese e ANOVA, cuja formulação e resultados estão indicados na Tabela 4. 9

16 Trabalho de Análise de Dados Tabela 4. Diferenças entre níveis de RPM para o mesmo nível de TiO2: resultados dos testes Nível baixo de TiO 2 Teste t para 2 amostras (assumindo variâncias diferentes 3 ) Nível médio de TiO 2 Teste ANOVA (assumindo variâncias iguais) Nível elevado de TiO 2 Teste t para 2 amostras (assumindo variâncias iguais 4 ) Hipóteses Resultado P-value H 0 : Os valores esperados das amostras são iguais (µ 25 -µ 30 =0) Não rejeitar H 0. H 1 : Os valores esperados das IC = [-7,73; 5,39] 0,714 amostras são diferentes H 0 : Os valores esperados das amostras são iguais H 1 : Pelo menos um valor Não rejeitar H 0. 0,798 esperado de uma amostra é diferente H 0 : Os valores esperados das amostras são iguais (µ 25 -µ =0) H 1 : Os valores esperados das amostras são diferentes Rejeitar H 0. IC = [-16,98; -0,93] 0,030 Face aos resultados expressos na Tabela 4, conclui-se que para os níveis de baixa e média concentração em dióxido de titânio (os que apresentam menores perdas) a variação do valor da variável RPM não conduz a variações significativas da variável dependente perdas por hora. Apenas quando a concentração em dióxido de titânio é elevada se mostra preferível a opção pelo valor de 25 RPM em detrimento do valor de RPM, uma vez que o primeiro apresenta perdas por hora inferiores. Assim, a concentração em dióxido de titânio surge como o principal fator estatisticamente significativo. Embora, numa primeira fase, os testes realizados indicassem a variável RPM como tendo impacto significativo na variação da variável da resposta, tal não se mostra tão claro após a análise conjugada das variáveis RPM e TiO2. Essa inferência inicial, que pode, agora, ser considerada falaciosa, mostra-se enviesada precisamente por causa do desequilíbrio observado na distribuição do número de observações pelos pares TiO2/RPM. Pretendendo-se a melhoria do desempenho do processo, o que se traduz, in casu, no objetivo de minimização das perdas, procurou-se, para finalizar a análise, estudar se para um nível de baixa concentração em TiO2 (que se mostra como o que potencia menor perdas) algum dos níveis das restantes variáveis independentes se mostra preferível. Dos diversos testes ANOVA realizados, cujo detalhe se encontra nos Anexos, destacam-se (por conduzirem à rejeição da hipótese nula) aqueles que envolvem o fluxo de H2O e o nível de vácuo Foi aplicado um teste bilateral à razão de variâncias (admitindo que são normais as populações a partir das quais se obtêm as amostras): o teste F. O resultado é de rejeição da hipótese nula (razão igual a 1), com um valor de prova de 0,005. Assim, admite-se no teste T que as variâncias são diferentes. 4 Neste caso, o resultado é de não rejeição da hipótese nula (razão igual a 1), com um valor de prova de 0,314. Assim, admite-se no teste T que as variâncias são iguais.

17 70 Boxplot da perda por hora para baixa concentração em TIO2, por fluxo de H20 O teste ANOVA resultou na rejeição da hipótese nula, com um valor de prova de 0, H2O flow 300 A construção de intervalos de Tukey a 95% sugere que a única diferença estatisticamente significativa é : [0,53; 15,73]. O nível 200 permite menores perdas do que o nível 300. Figura 9. Boxplot da perda por hora (baixa concentração em TiO2, por fluxo de H2O) 70 Boxplot da perda por hora para baixa concentração em TiO2, por nível de vácuo O teste ANOVA resultou na rejeição da hipótese nula, com um valor de prova de 0, H L Vacuum M N A construção de intervalos de Tukey a 95% sugere que a única diferença estatisticamente significativa é N-M: [-20,45; -1,07]. O nível N permite menores perdas do que o nível M. Figura 10. Boxplot da perda por hora (baixa concentração em TiO2, por nível de vácuo) 11

18 Trabalho de Análise de Dados 4 Conclusões e recomendações para a melhoria do processo O presente trabalho, relembre-se, visava delinear um conjunto de orientações que permitissem melhorar o processo de produção de uma empresa química a Chem, que tem apresentado problemas de desempenho, o que implicava compreender as principais causas de preocupação. Os autores depararam-se com um importante desafio assente na falta de informação sobre o processo químico em estudo, nomeadamente sobre as operações realizadas (e respetiva sequência) e sobre as variáveis que constam da folha de cálculo fornecida, que contém 100 observações recolhidas na última semana. Definiu-se como variável de resposta as perdas por hora, uma vez que constituem uma medida da performance do processo. O estudo desenvolvido teve, então, como objetivo a minimização do valor dessa variável. A análise realizada aos diversos inputs do processo identificou uma relação direta entre as variáveis TiO2 e supplier, inferindo-se que a concentração em dióxido de titânio do catalisador depende diretamente do respetivo fornecedor. Ulteriormente, a aplicação de diversas técnicas estatísticas conduziu à identificação das variáveis RPM (rotações por minuto) e TiO2 (concentração do catalisador em dióxido de titânio) enquanto fatores com impacto significativo na variação da variável de resposta. No entanto, uma análise posterior, conjugando os diferentes níveis de TiO2 e RPM, mostrou que apenas o fator TiO 2 deve ser tomado como significativo, já que a análise à variável RPM se apresentou enviesada pelo desequilíbrio do número de observações para cada par TiO2/RPM (para alguns níveis de RPM a amostra só incluía observações para certos níveis de TiO2). Assumindo que para a qualidade do produto final do processo em estudo é indiferente a concentração química do catalisador, então, para minimizar as perdas do processo, a empresa deverá recorrer a catalisadores com menor concentração em dióxido de titânio. Considerando a relação indicada acima, tal é equivalente a recomendar que a empresa privilegie o fornecedor Boopy. Em alternativa e tendo em conta as desvantagens e riscos da dependência excessiva duma empresa de apenas um fornecedor, a empresa deve procurar junto dos outros fornecedores (Sloppy e Grumpy), ou, em último caso, de terceiros, que estes adotem medidas que minimizem a concentração em dióxido de titânio dos seus catalisadores. A par deste diálogo, a Chem deve implementar uma política rigorosa de controlo de qualidade dos catalisadores recebidos dos seus fornecedores. 12

19 5 Trabalhos futuros Considerando alguns indícios evidenciados no estudo já desenvolvido e as críticas apontadas à amostra disponível, sugerem-se as seguintes análises/ações adicionais: (1) Após implementação da recomendação expressa na secção anterior privilegiar a utilização de catalisadores com baixa concentração em TiO2 e tendo em conta que a parte final da análise indiciou que, para níveis reduzidos de dióxido de titânio, as diferenças entre alguns dos níveis do fluxo de H2O e entre algumas das categorias de vácuo são estatisticamente significativas, será interessante recolher uma nova amostra, de maior dimensão e mais equilibrada 5, para concluir sobre a pertinência desses indícios, nomeadamente através da técnica de desenho de experiências; (2) A análise desenvolvida não contemplou a construção de cartas de controlo, por (i) não existir informação sobre a sequência cronológica de recolha da amostra e (ii) se desconhecer o detalhe do processo, nomeadamente eventuais limites de especificação para as variáveis. Assim, após adoção da recomendação já referida, seria interessante a implementação de cartas de controlo do tipo média e desvio padrão amostral ou média e amplitude, como meio de identificar pontos fora dos limites de controlo, sequências anormais de pontos e/ou padrões anormais de evolução, e, seguidamente, uma análise da capacidade do processo; (3) O envolvimento dos operários neste processo de melhoria é crucial, quer pelos benefícios inerentes à sua motivação, quer pelas sugestões úteis que podem advir da sua auscultação (e que podem, por exemplo, contribuir para a construção de diagramas de causa e efeito com maior aderência à realidade); (4) Dependendo do grau de complexidade da modelação do processo químico em estudo e dos custos em termos financeiros e de tempo intrínsecos à recolha sucessiva de amostras, o recurso a programas de simulação pode constituir uma boa alternativa. 5 Relembre-se que o desequilíbrio da amostra enviesou a análise do impacto da variável RPM na variação da variável de resposta. 13

20 Trabalho de Análise de Dados Bibliografia Cabral, J. A. Sarsfield Capítulo 5 Cartas de Controlo Shewhart. Faculdade de Engenharia da Universidade do Porto. Nóvoa, M. Henriqueta Sampaio da Melhoria da Qualidade Ferramentas da Qualidade Estatística e Minitab. Faculdade de Engenharia da Universidade do Porto. Nóvoa, M. Henriqueta Sampaio da Caso Tripcar Minitab. Faculdade de Engenharia da Universidade do Porto. 14

21 Anexos One-way ANOVA: versus H2O flow Method Null hypothesis All means are equal Alternative hypothesis At least one mean is different Significance level α = 0,05 Equal variances were assumed for the analysis. Factor Information Factor Levels Values H2O flow 3 200; 250; 300 Analysis of Variance Source DF Seq SS Contribution Adj SS Adj MS F-Value P-Value H2O flow 2 356,9 0,97% 356,9 178,5 0,48 0,623 Error ,4 99,03% 36427,4 375,5 Total ,3 100,00% Model Summary S R-sq R-sq(adj) PRESS R-sq(pred) 19,3789 0,97% 0,00% 38709,6 0,00% Means H2O flow N Mean StDev 95% CI ,53 21,63 (,93; 74,12) ,56 19,56 (64,86; 78,25) ,47 16,54 (64,78; 78,17) Pooled StDev = 19,

22 Trabalho de Análise de Dados One-way ANOVA: versus Operator Method Null hypothesis All means are equal Alternative hypothesis At least one mean is different Significance level α = 0,05 Equal variances were assumed for the analysis. Factor Information Factor Operator Levels Values 5 John; Mary; Mike; Sam; Sue Analysis of Variance Source DF Seq SS Contribution Adj SS Adj MS F-Value P-Value Operator 4 201,1 0,55% 201,1 50,29 0,13 0,971 Error ,2 99,45% 36583,2 385,09 Total ,3 100,00% Model Summary S R-sq R-sq(adj) PRESS R-sq(pred) 19,6236 0,55% 0,00% 535,4 0,00% Means Operator N Mean StDev 95% CI John 20 70,30 19,28 (61,59; 79,01) Mary 20 68,87 19,14 (,16; 77,58) Mike 20 71,75 21,33 (63,04; 80,46) Sam 20 71,63 20,83 (62,92; 80,34) Sue 20 68,24 17,28 (59,53; 76,95) Pooled StDev = 19,

23 One-way ANOVA: versus Vacuum Method Null hypothesis All means are equal Alternative hypothesis At least one mean is different Significance level α = 0,05 Equal variances were assumed for the analysis. Factor Information Factor Levels Values Vacuum 4 H; L; M; N Analysis of Variance Source DF Seq SS Contribution Adj SS Adj MS F-Value P-Value Vacuum 3 753,5 2,05% 753,5 251,2 0,67 0,573 Error ,8 97,95% 330,8 375,3 Total ,3 100,00% Model Summary S R-sq R-sq(adj) PRESS R-sq(pred) 19,3732 2,05% 0,00% 39096,0 0,00% Means Vacuum N Mean StDev 95% CI H 25 72,53 20,91 (64,84; 80,22) L 25 68,51 18,44 (,82; 76,20) M 25 73,08 17,11 (65,39; 80,77) N 25 66,52 20,77 (58,83; 74,21) Pooled StDev = 19,

24 Trabalho de Análise de Dados One-way ANOVA: versus Line Method Null hypothesis All means are equal Alternative hypothesis At least one mean is different Significance level α = 0,05 Equal variances were assumed for the analysis. Factor Information Factor Levels Values Line 5 5; 7; 9; 12; 15 Analysis of Variance Source DF Seq SS Contribution Adj SS Adj MS F-Value P-Value Line ,36% ,8 1,61 0,177 Error ,64% ,6 Total ,00% Model Summary S R-sq R-sq(adj) PRESS R-sq(pred) 19,0415 6,36% 2,42% 38166,3 0,00% Means Line N Mean StDev 95% CI ,09 19,93 (64,64; 81,54) ,98 26,65 (62,52; 79,43) ,48 15,67 (59,03; 75,94) ,55 10,76 (54,10; 71,00) ,69 18,55 (68,24; 85,15) Pooled StDev = 19,0415 Test for Equal Variances: versus Line Method Null hypothesis All variances are equal Alternative hypothesis At least one variance is different Significance level α = 0,05 Bartlett s method is used. This method is accurate for normal data only. 95% Bonferroni Confidence Intervals for Standard Deviations Line N StDev CI ,9280 (13,9845; 33,2037) ,6524 (18,7033; 44,77) ,6718 (10,9977; 26,1120) ,7617 ( 7,5520; 17,9309) ,5475 (13,0157; 30,9035) Individual confidence level = 99% Tests Test Method Statistic P-Value Bartlett 15,26 0,004 18

25 One-way ANOVA: versus RPM Method Null hypothesis All means are equal Alternative hypothesis At least one mean is different Significance level α = 0,05 Equal variances were assumed for the analysis. Factor Information Factor Levels Values RPM 4 25; 30; 35; Analysis of Variance Source DF Seq SS Contribution Adj SS Adj MS F-Value P-Value RPM ,08% ,6 24,22 0,000 Error ,92% ,1 Total ,00% Model Summary S R-sq R-sq(adj) PRESS R-sq(pred) 14, ,08% 41,30% 22628,8 38,48% Means RPM N Mean StDev 95% CI ,48 21,43 (59,94; 71,02) ,21 11,28 (50,67; 61,75) ,37 10,99 (67,26; 79,49) 21 91,48 11,05 (85,08; 97,88) Pooled StDev = 14,7679 Tukey Pairwise Comparisons Grouping Information Using the Tukey Method and 95% Confidence RPM N Mean Grouping 21 91,48 A ,37 B ,48 B C ,21 C Means that do not share a letter are significantly different. Tukey Simultaneous Tests for Differences of Means Difference Difference SE of Adjusted of Levels of Means Difference 95% CI T-Value P-Value ,28 3,95 (-19,; 1,05) -2,35 0, ,89 4,16 ( -2,98; 18,77) 1,90 0, ,00 4,26 ( 14,84; 37,15) 6,10 0, ,17 4,16 ( 6,30; 28,04) 4,13 0, ,27 4,26 ( 24,12; 46,43) 8,27 0, ,11 4,46 ( 6,44; 29,77) 4,06 0,001 Individual confidence level = 98,97% 19

26 Trabalho de Análise de Dados One-way ANOVA: versus Coded TiO2 Method Null hypothesis All means are equal Alternative hypothesis At least one mean is different Significance level α = 0,05 Equal variances were assumed for the analysis. Factor Information Factor Coded TiO2 Levels Values 3 L; M; H Analysis of Variance Source DF Seq SS Contribution Adj SS Adj MS F-Value P-Value Coded TiO ,91% ,5 161,50 0,000 Error ,09% ,6 Total ,00% Model Summary S R-sq R-sq(adj) PRESS R-sq(pred) 9, ,91% 76,43% 9038,07 75,43% Means Coded TiO2 N Mean StDev 95% CI L 51,25 8,65 (48,32; 54,19) M 30 74,13 8,48 (70,74; 77,53) H 30 91,39 10,97 (88,00; 94,78) Pooled StDev = 9,35842 Tukey Pairwise Comparisons Grouping Information Using the Tukey Method and 95% Confidence Coded TiO2 N Mean Grouping H 30 91,39 A M 30 74,13 B L 51,25 C Means that do not share a letter are significantly different. Tukey Simultaneous Tests for Differences of Means Difference Difference SE of Adjusted of Levels of Means Difference 95% CI T-Value P-Value M - L 22,88 2,26 (17,49; 28,27) 10,12 0,000 H - L,13 2,26 (34,75; 45,52) 17,76 0,000 H - M 17,25 2,42 (11,50; 23,01) 7,14 0,000 Individual confidence level = 98,09% 20

27 Test and CI for Two Variances: _L-25; _L-30 Method Null hypothesis Variance(_L-25) / Variance(_L-30) = 1 Alternative hypothesis Variance(_L-25) / Variance(_L-30) 1 Significance level α = 0,05 F method was used. This method is accurate for normal data only. Statistics 95% CI for Variable N StDev Variance Variances _L , ,301 (72,7; 319,303) _L ,867 34,418 (20,372; 70,289) Ratio of standard deviations = 1,968 Ratio of variances = 3,873 95% Confidence Intervals CI for CI for StDev Variance Method Ratio Ratio F (1,236; 3,258) (1,529; 10,613) Tests Test Method DF1 DF2 Statistic P-Value F ,87 0,005 Two-Sample T-Test and CI: _L-25; _L-30 Two-sample T for _L-25 vs _L-30 N Mean StDev SE Mean _L ,1 11,5 2,9 _L ,27 5,87 1,3 Difference = μ (_L-25) - μ (_L-30) Estimate for difference: -1,17 95% CI for difference: (-7,73; 5,39) T-Test of difference = 0 (vs ): T-Value = -0,37 P-Value = 0,714 DF = 20 21

28 Trabalho de Análise de Dados One-way ANOVA: _M-30; _M-35; _M- Method Null hypothesis All means are equal Alternative hypothesis At least one mean is different Significance level α = 0,05 Equal variances were assumed for the analysis. Factor Information Factor Levels Values Factor 3 _M-30; _M-35; _M- Analysis of Variance Source DF Seq SS Contribution Adj SS Adj MS F-Value P-Value Factor 2 34,68 1,66% 34,68 17,34 0,23 0,798 Error ,30 98,34% 2052,30 76,01 Total ,98 100,00% Model Summary S R-sq R-sq(adj) PRESS R-sq(pred) 8, ,66% 0,00% 2372,79 0,00% Means Factor N Mean StDev 95% CI _M ,30 6,50 (67,00; 81,) _M ,56 9,73 (69,56; 77,56) _M- 4 76,77 3,78 (67,83; 85,72) Pooled StDev = 8,

29 Test and CI for Two Variances: _H-25; _H- Method Null hypothesis Variance(_H-25) / Variance(_H-) = 1 Alternative hypothesis Variance(_H-25) / Variance(_H-) 1 Significance level α = 0,05 F method was used. This method is accurate for normal data only. Statistics 95% CI for Variable N StDev Variance Variances _H , ,086 (71,804; 412,488) _H- 17 9,121 83,187 (46,142; 192,684) Ratio of standard deviations = 1,312 Ratio of variances = 1,720 95% Confidence Intervals CI for CI for StDev Variance Method Ratio Ratio F (0,766; 2,384) (0,586; 5,684) Tests Test Method DF1 DF2 Statistic P-Value F ,72 0,314 Two-Sample T-Test and CI: _H-25; _H- Two-sample T for _H-25 vs _H- N Mean StDev SE Mean _H ,0 12,0 3,5 _H ,94 9,12 2,2 Difference = μ (_H-25) - μ (_H-) Estimate for difference: -8,95 95% CI for difference: (-16,98; -0,93) T-Test of difference = 0 (vs ): T-Value = -2,29 P-Value = 0,030 DF = 27 Both use Pooled StDev = 10,

30 Trabalho de Análise de Dados One-way ANOVA: versus H2O flow (apenas Boopy) Method Null hypothesis All means are equal Alternative hypothesis At least one mean is different Significance level α = 0,05 Equal variances were assumed for the analysis. Factor Information Factor Levels Values H2O flow 3 200; 250; 300 Analysis of Variance Source DF Seq SS Contribution Adj SS Adj MS F-Value P-Value H2O flow 2 496,5 17,01% 496,5 248,24 3,79 0,032 Error ,4 82,99% 2422,4 65,47 Total ,9 100,00% Model Summary S R-sq R-sq(adj) PRESS R-sq(pred) 8, ,01% 12,52% 2821,79 3,33% Means H2O flow N Mean StDev 95% CI ,56 10,85 (42,18; 50,94) ,88 6,11 (48,33; 57,43) ,69 6,08 (50,14; 59,24) Pooled StDev = 8,09141 Tukey Pairwise Comparisons Grouping Information Using the Tukey Method and 95% Confidence H2O flow N Mean Grouping ,69 A ,88 A B ,56 B Means that do not share a letter are significantly different. Tukey Simultaneous Tests for Differences of Means Difference Difference SE of Adjusted of Levels of Means Difference 95% CI T-Value P-Value ,32 3,12 (-1,28; 13,92) 2,03 0, ,13 3,12 ( 0,53; 15,73) 2,61 0, ,81 3,17 (-5,93; 9,55) 0,57 0,837 Individual confidence level = 98,04% 24

31 One-way ANOVA: versus Line (apenas Boopy) Method Null hypothesis All means are equal Alternative hypothesis At least one mean is different Significance level α = 0,05 Equal variances were assumed for the analysis. Factor Information Factor Levels Values Line 5 5; 7; 9; 12; 15 Analysis of Variance Source DF Seq SS Contribution Adj SS Adj MS F-Value P-Value Line 4 434,3 14,88% 434,3 108,57 1,53 0,215 Error ,6 85,12% 2484,6 70,99 Total ,9 100,00% Model Summary S R-sq R-sq(adj) PRESS R-sq(pred) 8, ,88% 5,15% 3358,38 0,00% Means Line N Mean StDev 95% CI ,66 11,90 (38,01; 53,31) ,93 10,94 (42,52; 53,34) ,58 6,43 (49,17; 59,98) ,51 4,05 (48,10; 58,92) ,35 8,96 (44,70;,00) Pooled StDev = 8,

32 Trabalho de Análise de Dados One-way ANOVA: versus Operator (apenas Boopy) Method Null hypothesis All means are equal Alternative hypothesis At least one mean is different Significance level α = 0,05 Equal variances were assumed for the analysis. Factor Information Factor Operator Levels Values 5 John; Mary; Mike; Sam; Sue Analysis of Variance Source DF Seq SS Contribution Adj SS Adj MS F-Value P-Value Operator 4 32,46 1,11% 32,46 8,115 0,10 0,982 Error ,45 98,89% 2886,45 82,470 Total ,91 100,00% Model Summary S R-sq R-sq(adj) PRESS R-sq(pred) 9, ,11% 0,00% 3770,05 0,00% Means Operator N Mean StDev 95% CI John 8 52,68 8,64 (46,16; 59,20) Mary 8 50,19 8,87 (43,67; 56,71) Mike 8 51,62 9,45 (45,10; 58,13) Sam 8 51, 10,24 (44,88; 57,92) Sue 8 50,39 8,06 (43,87; 56,91) Pooled StDev = 9,

33 One-way ANOVA: versus Vacuum (apenas Boopy) Method Null hypothesis All means are equal Alternative hypothesis At least one mean is different Significance level α = 0,05 Equal variances were assumed for the analysis. Factor Information Factor Levels Values Vacuum 4 H; L; M; N Analysis of Variance Source DF Seq SS Contribution Adj SS Adj MS F-Value P-Value Vacuum 3 592,2 20,29% 592,2 197, 3,05 0,041 Error ,7 79,71% 2326,7 64,63 Total ,9 100,00% Model Summary S R-sq R-sq(adj) PRESS R-sq(pred) 8, ,29% 13,65% 2872,47 1,59% Means Vacuum N Mean StDev 95% CI H 10 52,08 6,73 (46,92; 57,24) L 10 50,44 11,09 (45,29; 55,) M 10 56,63 4,07 (51,47; 61,78) N 10 45,87 8,58 (,71; 51,02) Pooled StDev = 8,03932 Tukey Pairwise Comparisons Grouping Information Using the Tukey Method and 95% Confidence Vacuum N Mean Grouping M 10 56,63 A H 10 52,08 A B L 10 50,44 A B N 10 45,87 B Means that do not share a letter are significantly different. Tukey Simultaneous Tests for Differences of Means Difference Difference SE of Adjusted of Levels of Means Difference 95% CI T-Value P-Value L - H -1,64 3, (-11,32; 8,05) -0,46 0,968 M - H 4,55 3, ( -5,14; 14,23) 1,26 0,591 N - H -6,21 3, (-15,90; 3,47) -1,73 0,324 M - L 6,18 3, ( -3,50; 15,87) 1,72 0,329 N - L -4,58 3, (-14,26; 5,11) -1,27 0,586 N - M -10,76 3, (-20,45; -1,07) -2,99 0,025 Individual confidence level = 98,93% 27

Teste de hipóteses. Testes de Hipóteses. Valor de p ou P-valor. Lógica dos testes de hipótese. Valor de p 31/08/2016 VPS126

Teste de hipóteses. Testes de Hipóteses. Valor de p ou P-valor. Lógica dos testes de hipótese. Valor de p 31/08/2016 VPS126 3/8/26 Teste de hipóteses Testes de Hipóteses VPS26 Ferramenta estatística para auxiliar no acúmulo de evidências sobre uma questão Média de glicemia de um grupo de animais é diferente do esperado? Qual

Leia mais

1) Como vou comparar 3 grupos realizo uma Anova one way:

1) Como vou comparar 3 grupos realizo uma Anova one way: Gabarito aula anova e teste não-paramétrico: 1) Como vou comparar 3 grupos realizo uma Anova one way: One-way ANOVA: AREA versus VIRUS Analysis of Variance for AREA Source DF SS MS F P VIRUS 2 215,54 107,77

Leia mais

Regression and Clinical prediction models

Regression and Clinical prediction models Regression and Clinical prediction models Session 4 Introducing statistical modeling Part 1 (Analysis of variance) Pedro E A A do Brasil pedro.brasil@ini.fiocruz.br 2018 Objetivos Introduzir a ideia de

Leia mais

UMA PESQUISA EXPLORATORIA DOS INDICADORES DO IRBEM-2011 DA REDE NOSSA SÃO PAULO

UMA PESQUISA EXPLORATORIA DOS INDICADORES DO IRBEM-2011 DA REDE NOSSA SÃO PAULO PONTÍFICIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Faculdade de Economia, Administração, Contabilidade e Atuariais UMA PESQUISA EXPLORATORIA DOS INDICADORES DO IRBEM-2011 DA REDE NOSSA SÃO PAULO Aluno: Claudemir

Leia mais

Exame Final de Métodos Estatísticos

Exame Final de Métodos Estatísticos Exame Final de Métodos Estatísticos Data: de Junho de 26 Duração: 3h. Nome: Curso: Declaro que desisto N. Mec. Regime: As cotações deste exame encontram-se na seguinte tabela. Responda às questões utilizando

Leia mais

Aula 7. Testes de Hipóteses Paramétricos (II)

Aula 7. Testes de Hipóteses Paramétricos (II) Aula 7. Testes de Hipóteses Paramétricos (II) Métodos Estadísticos 008 Universidade de Averio Profª Gladys Castillo Jordán IC e TH para comparação de valores médios µ X e µ Y de duas populações Normais.

Leia mais

Aula 7. Testes de Hipóteses Paramétricos (II)

Aula 7. Testes de Hipóteses Paramétricos (II) Aula 7. Testes de Hipóteses Paramétricos (II) Métodos Estadísticos 008 Universidade de Averio Profª Gladys Castillo Jordán IC e TH para comparação de valores médios µ X e µ Y de duas populações Normais.

Leia mais

Exame de Recorrência de Métodos Estatísticos. Departamento de Matemática Universidade de Aveiro

Exame de Recorrência de Métodos Estatísticos. Departamento de Matemática Universidade de Aveiro Exame de Recorrência de Métodos Estatísticos Departamento de Matemática Universidade de Aveiro Data: 6/6/6 Duração: 3 horas Nome: N.º: Curso: Regime: Declaro que desisto Classificação: As cotações deste

Leia mais

UNIVERSIDADE DE SÃO PAULO

UNIVERSIDADE DE SÃO PAULO UNIVERSIDADE DE SÃO PAULO ESCOLA SUPERIOR DE AGRICULTURA "LUIZ DE QUEIROZ" DEPARTAMENTO DE CIÊNCIAS EXATAS RELATÓRIO DE ATIVIDADE PRÁTICA Relatório da aula prática nº 1, da disciplina LCE602 - Estatística

Leia mais

Estatística descritiva

Estatística descritiva Estatística descritiva Para que serve a estatística? Qual o seu principal objectivo? obter conclusões sobre a população usando uma amostra? População Amostragem Amostra Uma ou mais variáveis (X) são observadas

Leia mais

Técnicas Computacionais em Probabilidade e Estatística I. Aula I

Técnicas Computacionais em Probabilidade e Estatística I. Aula I Técnicas Computacionais em Probabilidade e Estatística I Aula I Chang Chiann MAE 5704- IME/USP 1º Sem/2008 1 Análise de Um conjunto de dados objetivo: tratamento de um conjunto de dados. uma amostra de

Leia mais

ENADE Exame Nacional de Desempenho de Estudantes. Instituições do Ensino Superior do Município de São Paulo

ENADE Exame Nacional de Desempenho de Estudantes. Instituições do Ensino Superior do Município de São Paulo PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO PUC-SP MÉTODOS QUANTITATIVOS DE PESQUISA EMPÍRICA Prof. Dr. ARNOLDO HOYOS ENADE 9 Exame Nacional de Desempenho de Estudantes Instituições do Ensino Superior

Leia mais

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO FEA - FACULDADE DE ECONOMIA E ADMINISTRAÇÃO PROGRAMA DE ESTUDOS PÓS-GRADUADOS EM ADMINISTRAÇÃO

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO FEA - FACULDADE DE ECONOMIA E ADMINISTRAÇÃO PROGRAMA DE ESTUDOS PÓS-GRADUADOS EM ADMINISTRAÇÃO PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO FEA - FACULDADE DE ECONOMIA E ADMINISTRAÇÃO PROGRAMA DE ESTUDOS PÓS-GRADUADOS EM ADMINISTRAÇÃO PESQUISA SOCIO-ECONOMICA AO NIVEL MUNICPAL NO BRASIL Focando

Leia mais

UMA ANÁLISE DE ÍNDICES DE DESENVOLVIMENTO BÁSICO DA REGIÃO DE ARARAS

UMA ANÁLISE DE ÍNDICES DE DESENVOLVIMENTO BÁSICO DA REGIÃO DE ARARAS PONTÍFICIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Faculdade de Economia, Administração, Contabilidade e Atuariais UMA ANÁLISE DE ÍNDICES DE DESENVOLVIMENTO BÁSICO DA REGIÃO DE ARARAS Aluna: Erika Camila Buzo

Leia mais

4-Teste de Hipóteses. Teste de Hipóteses

4-Teste de Hipóteses. Teste de Hipóteses Teste de Procedimentos Gerais Teste de média Z para 1 amostra Teste de média t para 1 amostra Teste de variância para 2 amostras A Distribuição de Fisher Teste de média t para 2 amostras Teste de média

Leia mais

PROCESSOS ESTOCÁSTICOS

PROCESSOS ESTOCÁSTICOS PROCESSOS ESTOCÁSTICOS PNV 2452 TRATAMENTO E ANÁLISE DE DADOS 2015 MOTIVAÇÃO PARA A ANÁLISE DE DADOS Data Summary Number of Data Points = 30000 Min Data Value = 0.00262 Max Data Value = 982 Sample Mean

Leia mais

ANOVA - Etapas de Análise

ANOVA - Etapas de Análise ANOVA - Etapas de Análise Entender o Delineamento Estrutura de Tratamento Aleatorização das Unidades Amostrais Aleatorização das Unidades Experimentais aos Tratamentos Adotar um Modelo Estrutural e Distribucional

Leia mais

UMA ANÁLISE COMPARATIVA DE DESESENVOLVIMENTO POR ESTADO NO BRASIL A PARTIR DE ALGUNS INDICADORES DO IBGE

UMA ANÁLISE COMPARATIVA DE DESESENVOLVIMENTO POR ESTADO NO BRASIL A PARTIR DE ALGUNS INDICADORES DO IBGE PONTÍFICIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Faculdade de Economia, Administração, Contabilidade e Atuariais UMA ANÁLISE COMPARATIVA DE DESESENVOLVIMENTO POR ESTADO NO BRASIL A PARTIR DE ALGUNS INDICADORES

Leia mais

INSTITUTO SUPERIOR DE CONTABILIDADE E ADMINISTRAÇÃO PORTO Ano lectivo 2009/20010 EXAME: DATA 24 / 02 / NOME DO ALUNO:

INSTITUTO SUPERIOR DE CONTABILIDADE E ADMINISTRAÇÃO PORTO Ano lectivo 2009/20010 EXAME: DATA 24 / 02 / NOME DO ALUNO: INSTITUTO SUPERIOR DE CONTABILIDADE E ADMINISTRAÇÃO PORTO Ano lectivo 2009/20010 Estudos de Mercado EXAME: DATA 24 / 02 / 20010 NOME DO ALUNO: Nº INFORMÁTICO: TURMA: PÁG. 1_ PROFESSOR: ÉPOCA: Grupo I (10

Leia mais

ATLAS BRASIL 2013 DIMENSÃO DESINVOLVIMENTO HUMANO E OUTRAS VARIÁVEIS

ATLAS BRASIL 2013 DIMENSÃO DESINVOLVIMENTO HUMANO E OUTRAS VARIÁVEIS PONTÍFICIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Faculdade de Economia, Administração, Contabilidade e Atuariais. ATLAS BRASIL 2013 DIMENSÃO DESINVOLVIMENTO HUMANO E OUTRAS VARIÁVEIS Disciplina: Métodos Quantitativos

Leia mais

I.1. Seleccionado um passageiro ao acaso, qual a probabilidade de ter idade no intervalo [20 a 50) anos e ser fraudulento?

I.1. Seleccionado um passageiro ao acaso, qual a probabilidade de ter idade no intervalo [20 a 50) anos e ser fraudulento? INTRODUÇÃO À ANÁLISE DE DADOS INSTITUTO SUPERIOR DE CIÊNCIAS SOCIAIS E POLÍTICAS UNIVERSIDADE TÉCNICA DE LISBOA Frequência - 29 de Janeiro de 8 Grupo I (4, v) No seguimento de um estudo efectuado pela

Leia mais

Planejamento e Pesquisa 1. Dois Grupos

Planejamento e Pesquisa 1. Dois Grupos Planejamento e Pesquisa 1 Dois Grupos Conceitos básicos Comparando dois grupos Testes t para duas amostras independentes Testes t para amostras pareadas Suposições e Diagnóstico Comparação de mais que

Leia mais

Testes de Hipóteses. : Existe efeito

Testes de Hipóteses. : Existe efeito Testes de Hipóteses Hipótese Estatística de teste Distribuição da estatística de teste Decisão H 0 : Não existe efeito vs. H 1 : Existe efeito Hipótese nula Hipótese alternativa Varia conforme a natureza

Leia mais

Aula Prática 02 Estatística Experimental DELINEAMENTO CASUALIZADO EM BLOCOS. *Planejamento do Experimento Delineamento Casualizado em Blocos (DBC);

Aula Prática 02 Estatística Experimental DELINEAMENTO CASUALIZADO EM BLOCOS. *Planejamento do Experimento Delineamento Casualizado em Blocos (DBC); Aula Prática 02 Estatística Experimental DELINEAMENTO CASUALIZADO EM BLOCOS *Planejamento do Experimento Delineamento Casualizado em Blocos (DBC); proc plan; factors blocos=3 ordered parcelas=9 ordered;

Leia mais

Exame de Recurso de Métodos Estatísticos. Departamento de Matemática Universidade de Aveiro

Exame de Recurso de Métodos Estatísticos. Departamento de Matemática Universidade de Aveiro Exame de Recurso de Métodos Estatísticos Departamento de Matemática Universidade de Aveiro Data: /7/6 Duração: 3 horas Nome: N.º: Curso: Regime: Declaro que desisto Classificação: As cotações deste exame

Leia mais

O poder da ANOVA e da igualdade de variância

O poder da ANOVA e da igualdade de variância O poder da ANOVA e da igualdade de variância Por Marcelo Rivas Fernandes A ANOVA e o Teste de Iguldade de Variância são tão imprescindíveis para a estatística inferencial, quanto a média e o desvio padrão

Leia mais

ANÁLISE ESTATÍSTICA DOS ÍNDICES DE DESENVOLVIMENTO DAS AMÉRICAS, BASEADA NO HDR Fátima Alexandre

ANÁLISE ESTATÍSTICA DOS ÍNDICES DE DESENVOLVIMENTO DAS AMÉRICAS, BASEADA NO HDR Fátima Alexandre ANÁLISE ESTATÍSTICA DOS ÍNDICES DE DESENVOLVIMENTO DAS AMÉRICAS, BASEADA NO HDR 2005 Fátima Alexandre PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO FEA - Faculdade de Economia e Administração Programa

Leia mais

Modelos de Análise de Variância

Modelos de Análise de Variância Modelos de Análise de Variância Delineamento Completamente Aleatorizado: k tratamentos, r réplicas (balanceado) yi iid ~ N ; i i Normalidade Variância constante ( homocedasticidade ) Independência Análise

Leia mais

Curso de MINITAB Universidade Federal de Ouro Preto. Planejamento de Experimentos (DOE)

Curso de MINITAB Universidade Federal de Ouro Preto. Planejamento de Experimentos (DOE) Planejamento de Experimentos (DOE) - Introdução Um experimento é um procedimento no qual as alterações propositais são feitas nas variáveis de entrada de um processo ou sistema, de modo que se possa avaliar

Leia mais

Trabalho 5. Gustavo Mello Reis Página 1

Trabalho 5. Gustavo Mello Reis Página 1 Trabalho 5 Gustavo Mello Reis Página ) a) Uma empresa fabricante de pentes deseja melhorar seu controle de qualidade. Para isto, a empresa selecionou 5 lotes de 00 unidades. Para cada lote foram amostrados

Leia mais

BA STA BOLETIM DE ANÁLISE ESTATÍSTICO. Pesquisas Relacionadas a Indicadores Municipais no Brasil. ISDM/FGV, IFDM e IFGF/FIRJAN BASTA 2013 V2

BA STA BOLETIM DE ANÁLISE ESTATÍSTICO. Pesquisas Relacionadas a Indicadores Municipais no Brasil. ISDM/FGV, IFDM e IFGF/FIRJAN BASTA 2013 V2 BA STA BOLETIM DE ANÁLISE ESTATÍSTICO Pesquisas Relacionadas a Indicadores Municipais no Brasil ISDM/FGV, IFDM e IFGF/FIRJAN BASTA 2013 V2 Pesquisa socio-economica ao nível municipal no Brasil focando

Leia mais

ANÁLISE DE DADOS ANÁLISE PARCIAL DOS RESULTADOS DOS EXAMES NACIONAIS DO ENSINO SECUNDÁRIO DE Sérgio Sobral Nunes

ANÁLISE DE DADOS ANÁLISE PARCIAL DOS RESULTADOS DOS EXAMES NACIONAIS DO ENSINO SECUNDÁRIO DE Sérgio Sobral Nunes ANÁLISE DE DADOS ANÁLISE PARCIAL DOS RESULTADOS DOS EXAMES NACIONAIS DO ENSINO SECUNDÁRIO DE 2001 Sérgio Sobral Nunes Análise de Dados Mestrado em Gestão de Informação, Setembro de 2002 Índice 1 DESCRIÇÃO

Leia mais

DELINEAMENTO EM BLOCOS CASUALIZADOS COM REPETIÇÕES. Profª. Sheila Regina Oro

DELINEAMENTO EM BLOCOS CASUALIZADOS COM REPETIÇÕES. Profª. Sheila Regina Oro DELINEAMENTO EM BLOCOS CASUALIZADOS COM REPETIÇÕES Profª. Sheila Regina Oro Delineamento em Blocos Casualizados com Repetições (DBCr) Utilizado quando temos mais de uma repetição de cada tratamento dentro

Leia mais

Análise de Variância. Análise de Variância. Análise de Variância. Análise de Variância. Análise de Variância. Mestrado em Recreação e Lazer

Análise de Variância. Análise de Variância. Análise de Variância. Análise de Variância. Análise de Variância. Mestrado em Recreação e Lazer Mestrado em Recreação e Lazer Estudos Práticos ANalysis Of VAriance O que é? Permite verificar qual o EFEITO de uma variável independente, de natureza qualitativa (factor), numa variável dependente ou

Leia mais

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Programa de Estudos Pós-Graduados em Administração Mestrado em Administração

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Programa de Estudos Pós-Graduados em Administração Mestrado em Administração PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Programa de Estudos Pós-Graduados em Administração Mestrado em Administração PESQUISA SOCIO-ECONOMICA AO NIVEL MUNICIPAL NO BRASIL focando principalmente indicadores

Leia mais

Regression and Clinical prediction models

Regression and Clinical prediction models Regression and Clinical prediction models Session 6 Introducing statistical modeling Part 2 (Correlation and Linear regression) Pedro E A A do Brasil pedro.brasil@ini.fiocruz.br 2018 Objetivos Continuar

Leia mais

Tópicos Extras 1ª parte. Testes Não Paramétricos, Análise Multivariada, Outras Técnicas

Tópicos Extras 1ª parte. Testes Não Paramétricos, Análise Multivariada, Outras Técnicas Tópicos Extras 1ª parte Testes Não Paramétricos, Análise Multivariada, Outras Técnicas 1 2 Técnicas de dependência 3 4 Situações Comparar 3 tipos de rede de computadores, C1, C2 e C3, em termos do tempo

Leia mais

Variância pop. * conhecida Teste t Paramétrico Quantitativa Distribuição normal Wilcoxon (teste dos sinais, Wilcoxon p/ 1 amostra)

Variância pop. * conhecida Teste t Paramétrico Quantitativa Distribuição normal Wilcoxon (teste dos sinais, Wilcoxon p/ 1 amostra) Testes de Tendência Central (média, mediana, proporção) Classificação Variável 1 Variável 2 Núm ero Gru pos Dependência Teste Z Paramétrico Quantitativa - 1 - Premissas Variância pop. * conhecida Teste

Leia mais

Módulo 16- Análise de Regressão

Módulo 16- Análise de Regressão Módulo 6 Análise de Regressão Módulo 6- Análise de Regressão Situação Problema Um grupo de investidores estrangeiros deseja aumentar suas atividades no Brasil. Considerando a conjuntura econômica de moeda

Leia mais

Aula no SAS. Planejamento do Experimento - Delineamento inteiramente casualizado. Saídas

Aula no SAS. Planejamento do Experimento - Delineamento inteiramente casualizado. Saídas Aula no SAS Planejamento do Experimento - Delineamento inteiramente casualizado Saídas title "Antes da Casualização"; data plano; do parc=1 to 20;*DEVE SER MÚLTIPLO DO NÚMERO DE TRATAMENTOS; trat=int((parc-1)/5)+1;*tratamentos+1=5;

Leia mais

UNIVERSIDADE DE SÃO PAULO

UNIVERSIDADE DE SÃO PAULO UNIVERSIDADE DE SÃO PAULO ESCOLA SUPERIOR DE AGRICULTURA "LUIZ DE QUEIROZ" DEPARTAMENTO DE CIÊNCIAS EXATAS RELATÓRIO DE ATIVIDADE PRÁTICA Relatório da aula prática nº 2, da disciplina LCE602 - Estatística

Leia mais

'HVFULomRH$QiOLVH([SORUDWyULDGRV'DGRV

'HVFULomRH$QiOLVH([SORUDWyULDGRV'DGRV 69 'HVFULomRH$QiOLVH([SORUDWyULDGRV'DGRV O presente capítulo objetiva entender o comportamento das séries de retorno financeiras para as carteiras de investimento elaboradas no capítulo anterior. Tal análise

Leia mais

Análise de Variância e outras análises. Airlane P. Alencar

Análise de Variância e outras análises. Airlane P. Alencar Análise de Variância e outras análises 2018 Airlane P. Alencar Introdução: Análise de Variância Caso particular do modelo de regressão: As variáveis explicativas são em geral, de natureza qualitativa (chamadas

Leia mais

Projeto de Experimentos

Projeto de Experimentos Projeto de Experimentos O uso de Projeto de Experimentos conduz a uma seqüência estruturada de ensaios, que assegura o máximo de informação com um gasto mínimo de tempo/dinheiro. Entrada Processo Saída

Leia mais

Aplicação de Planejamento de Experimentos Fatorial para verificação do peso final de três marcas de Macarrão Instantâneo

Aplicação de Planejamento de Experimentos Fatorial para verificação do peso final de três marcas de Macarrão Instantâneo Aplicação de Planejamento de Experimentos Fatorial para verificação do peso final de três marcas de Macarrão Instantâneo Introdução Aline dos Santos Ferreira André Luis Alves Costa Elaine do Carmo de Lima

Leia mais

MÉTODOS QUANTITATIVOS APLICADOS

MÉTODOS QUANTITATIVOS APLICADOS ANO LECTIVO DE 2013-2014 MÉTODOS QUANTITATIVOS APLICADOS Mestrados: Economia, Economia e Gestão de Ciência, Tecnologia e Inovação, Economia e Políticas Públicas, Economia Internacional e Estudos Europeus

Leia mais

Variável dependente Variável independente Coeficiente de regressão Relação causa-efeito

Variável dependente Variável independente Coeficiente de regressão Relação causa-efeito Unidade IV - Regressão Regressões Lineares Modelo de Regressão Linear Simples Terminologia Variável dependente Variável independente Coeficiente de regressão Relação causa-efeito Regressão correlação Diferença

Leia mais

BIOESTATÍSTICA. Parte 5 Testes de Hipóteses

BIOESTATÍSTICA. Parte 5 Testes de Hipóteses BIOESTATÍSTICA Parte 5 Testes de Hipóteses Aulas Teóricas de 05/05/2011 a 19/05/2011 5.1. Conceito de erro, estatística de teste, região de rejeição, nível de significância, valor de prova, potência do

Leia mais

Testes de significância com dados multivariados

Testes de significância com dados multivariados Testes de significância com dados multivariados Hiron Pereira Farias e Talita T. Fernandes Wednesday, January 20, 2016 Hiron Pereira Farias e Talita T. Fernandes Testes de significância com dados multivariadoswednesday,

Leia mais

Estatística Aplicada II. } Regressão Linear

Estatística Aplicada II. } Regressão Linear Estatística Aplicada II } Regressão Linear 1 Aula de hoje } Tópicos } Regressão Linear } Referência } Barrow, M. Estatística para economia, contabilidade e administração. São Paulo: Ática, 007, Cap. 7

Leia mais

i j i i Y X X X i j i i i

i j i i Y X X X i j i i i Mario de Andrade Lira Junior lira.pro.br\wordpress lira.pro.br\wordpress Diferença Regressão - equação ligando duas ou mais variáveis Correlação medida do grau de ligação entre duas variáveis Usos Regressão

Leia mais

Capacitação em R e RStudio PROJETO DE EXTENSÃO. Software R: capacitação em análise estatística de dados utilizando um software livre.

Capacitação em R e RStudio PROJETO DE EXTENSÃO. Software R: capacitação em análise estatística de dados utilizando um software livre. UFFS Universidade Federal da Fronteira Sul Campus Cerro Largo PROJETO DE EXTENSÃO Software R: capacitação em análise estatística de dados utilizando um software livre Fonte: https://www.r-project.org/

Leia mais

Escolha dos testes INTRODUÇÃO À BIOESTATÍSTICA QUANTIFICAÇÃO DOS GRUPOS DO ESTUDO PESQUISA INFERÊNCIA ESTATÍSTICA TESTE DE HIPÓTESES E

Escolha dos testes INTRODUÇÃO À BIOESTATÍSTICA QUANTIFICAÇÃO DOS GRUPOS DO ESTUDO PESQUISA INFERÊNCIA ESTATÍSTICA TESTE DE HIPÓTESES E Escolha dos testes INTRODUÇÃO À BIOESTATÍSTICA Determinada a pergunta/ hipótese Recolhidos os dados Análise descritiva = Estatística descritiva QUAIS TESTES ESTATÍSTICOS DEVEM SER REALIZADOS?? PROFESSORA:

Leia mais

Teste de Hipóteses (ou Teste de Significância)

Teste de Hipóteses (ou Teste de Significância) Teste de Hipóteses (ou Teste de Significância) Pedro Paulo Balestrassi www.pedro.unifei.edu.br ppbalestrassi@gmail.com 35-36291161 / 88776958 (cel) 1 São diferenças estatisticamente significantes? A B

Leia mais

UM ESTUDO COMPARATIVO DO USO DO MINITAB, SPSS E XL-STAT EM REGRESSÕES UTILZIANDO DADOS SOBRE LIBERDADE ECONÔMICA DE 157 PAÍSES NO CENÁRIO MUNDIAL

UM ESTUDO COMPARATIVO DO USO DO MINITAB, SPSS E XL-STAT EM REGRESSÕES UTILZIANDO DADOS SOBRE LIBERDADE ECONÔMICA DE 157 PAÍSES NO CENÁRIO MUNDIAL UM ESTUDO COMPARATIVO DO USO DO MINITAB, SPSS E XL-STAT EM REGRESSÕES UTILZIANDO DADOS SOBRE LIBERDADE ECONÔMICA DE 157 PAÍSES NO CENÁRIO MUNDIAL LOURENÇO AUGUSTO C. GRANATO PONTIFÍCIA UNIVERSIDADE CATÓLICA

Leia mais

TESTES DE HIPÓTESES - Generalidades

TESTES DE HIPÓTESES - Generalidades TESTES DE HIPÓTESES - Generalidades Uma hipótese estatística é uma conjectura sobre uma característica da população. Um teste de hipóteses é um procedimento estatístico que averigua se os dados sustentam

Leia mais

Planejamento de Experimentos Suposições do Modelo e Comparações Múltiplas

Planejamento de Experimentos Suposições do Modelo e Comparações Múltiplas 1 / 30 Planejamento de Experimentos Suposições do Modelo e Comparações Múltiplas Enrico A. Colosimo/UFMG Depto. Estatística - ICEx - UFMG 2 / 30 Exemplo típico: Resistência de uma nova fibra sintética

Leia mais

PESQUISA NOSSA SÃO PAULO QUALIDADE DE VIDA URBANA EM. SÃO PAULO Um estudo de correlações entre trabalho e renda e violência.

PESQUISA NOSSA SÃO PAULO QUALIDADE DE VIDA URBANA EM. SÃO PAULO Um estudo de correlações entre trabalho e renda e violência. PESQUISA NOSSA SÃO PAULO QUALIDADE DE VIDA URBANA EM SÃO PAULO Um estudo de correlações entre trabalho e renda e violência urbana DANIEL RODRIGUES PIRES BEZERRA PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO

Leia mais

Modelos de Escolha Discreta. a)pretende-se conhecer os coeficientes da função de utilidade, assim como a sua significância estatística.

Modelos de Escolha Discreta. a)pretende-se conhecer os coeficientes da função de utilidade, assim como a sua significância estatística. Nº Observações espaço Lx centro espaço periferia nº clientes (15 min) centro Lx nº clientes (15 min) periferia estacionamento centro Lx estacionamento periferia tc rodo centro Lx tc rodo periferia Código

Leia mais

BAC011 - ESTATÍSTICA ANÁLISE DE VARIÂNCIA. Análise de Variância ANOVA. Prof. Dr. Emerson José de Paiva

BAC011 - ESTATÍSTICA ANÁLISE DE VARIÂNCIA. Análise de Variância ANOVA. Prof. Dr. Emerson José de Paiva BAC011 - ESTATÍSTICA Análise de Variância ANÁLISE DE VARIÂNCIA 1 A é utilizada para se verificar a influência de certos fatores sobre uma resposta de interesse. Testa-se como os diversos fatores exercem

Leia mais

PONTÍFICA UNIVERSIDADE CATÓLICA DE SÃO PAULO PROGRAMA DE ESTUDOS PÓS-GRADUADOS EM ADMINISTRAÇÃO/ PUC-SP

PONTÍFICA UNIVERSIDADE CATÓLICA DE SÃO PAULO PROGRAMA DE ESTUDOS PÓS-GRADUADOS EM ADMINISTRAÇÃO/ PUC-SP PONTÍFICA UNIVERSIDADE CATÓLICA DE SÃO PAULO PROGRAMA DE ESTUDOS PÓS-GRADUADOS EM ADMINISTRAÇÃO/ PUC-SP MÉTODOS QUANTITAIVOS TRABALHO FINAL º SEMESTRE PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO FEA

Leia mais

BOLETIM DE ANÁLISE ESTATÍSTICO BASTA 2017 Vol. 1 IDHM

BOLETIM DE ANÁLISE ESTATÍSTICO BASTA 2017 Vol. 1 IDHM PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Programas de Pós Graduação em Economia e Administração da PUC-SP BOLETIM DE ANÁLISE ESTATÍSTICO BASTA 2017 Vol. 1 IDHM ÍNDICE DE DESENVOLVIMENTO HUMANO MUNICIPAL

Leia mais

Estatística Descritiva (II)

Estatística Descritiva (II) Estatística Descritiva (II) Arquivo PULSE do Minitab Experimento envolvendo alunos. Cada um tem altura, peso, sexo, hábito de fumar e nível de atividade física anotados. Todos jogam moedas: se CARA, é

Leia mais

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO PUC-SP

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO PUC-SP PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO PUC-SP PESQUISA SOCIO-ECONOMICA AO NIVEL MUNICIPAL NO BRASIL Focando principalmente indicadores relacionados a Habitação, Educação, Saúde e muito particularmente

Leia mais

EXEMPLOS DE CÁLCULO DO TAMANHO AMOSTRAL. Desenvolvido por Lucas Lima Ayres

EXEMPLOS DE CÁLCULO DO TAMANHO AMOSTRAL. Desenvolvido por Lucas Lima Ayres EXEMPLOS DE CÁLCULO DO TAMANHO AMOSTRAL Desenvolvido por Lucas Lima Ayres Belo Horizonte/2015 1 1. INTERVALOS DE CONFIANÇA PARA UMA PROPORÇÃO 1.1. ASSINTÓTICO 1.1.1. ASSINTÓTICO SIMPLES 1.1.1.1.BILATERAL

Leia mais

SHOW. [DataSet1] C:\Documents and Settings\Tito\Ambiente de trabalho\almas\dadostodoscomresiduos.sav

SHOW. [DataSet1] C:\Documents and Settings\Tito\Ambiente de trabalho\almas\dadostodoscomresiduos.sav GET FILE=' '. DATASET NAME Set1 WINDOW=FRONT. PRESERVE. SET RNG=MT MTINDEX=2000000. SHOW RNG. SHOW Output Created 21-DEC-2013 23:23:56 Active set Set1 SHOW RNG. Processor Time 00:00:00,00 Elapsed Time

Leia mais

Preços de venda de imóveis residenciais em Seattle estudo estatístico

Preços de venda de imóveis residenciais em Seattle estudo estatístico Faculdade de Engenharia da Universidade do Porto Departamento de Engenharia Industrial e Gestão Preços de venda de imóveis residenciais em Seattle estudo estatístico Mestrado Integrado em Engenharia Industrial

Leia mais

UNIVERSIDADE FEDERAL DA FRONTEIRA SUL Campus CERRO LARGO. PROJETO DE EXTENSÃO Software R: de dados utilizando um software livre.

UNIVERSIDADE FEDERAL DA FRONTEIRA SUL Campus CERRO LARGO. PROJETO DE EXTENSÃO Software R: de dados utilizando um software livre. UNIVERSIDADE FEDERAL DA FRONTEIRA SUL Campus CERRO LARGO PROJETO DE EXTENSÃO Software R: Capacitação em análise estatística de dados utilizando um software livre. Fonte: https://www.r-project.org/ Módulo

Leia mais

UNIVERSIDADE FEDERAL DE MINAS GERAIS. Confiabilidade Lista 4. Professor: Enrico Colosimo Aluno: Augusto Filho Belo Horizonte - MG

UNIVERSIDADE FEDERAL DE MINAS GERAIS. Confiabilidade Lista 4. Professor: Enrico Colosimo Aluno: Augusto Filho Belo Horizonte - MG UNIVERSIDADE FEDERAL DE MINAS GERAIS ESPECIALIZAÇÃO EM ESTATÍSTICA Confiabilidade Lista 4 Professor: Enrico Colosimo Belo Horizonte - MG 2 Exercício 1. Os dados abaixo foram apresentados por Nelson & Schmee

Leia mais

Tomada de Decisão para uma Única Amostra

Tomada de Decisão para uma Única Amostra Tomada de Decisão para uma Única Amostra Testes de Hipóteses Teste de Hipóteses Procedimento de tomada de decisão sobre hipóteses envolvendo a população Aspecto bastante útil da Inferência Estatística:

Leia mais

Bioestatística Básica

Bioestatística Básica Bioestatística Básica Curso de Pós-Graduação RCA 5804 PROF. DR. ALFREDO J RODRIGUES DEPARTAMENTO DE CIRURGIA E ANATOMIA FACULDADE DE MEDICINA DE RIBEIRÃO PRETO UNIVERSIDADE DE SÃO PAULO alfredo@fmrp.usp.br

Leia mais

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO FEA - Faculdade de Economia e Administração Programa de Estudos Pós-Graduados em Administração

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO FEA - Faculdade de Economia e Administração Programa de Estudos Pós-Graduados em Administração PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO FEA - Faculdade de Economia e Administração Programa de Estudos Pós-Graduados em Administração PESQUISA IRBEM INDICADORES DE REFERÊNCIA DE BEM-ESTAR NO MUNICÍPIO

Leia mais

Construção da base de dados

Construção da base de dados Construção da base de dados Construção da base de dados Construção da base de dados Exemplos de Inquéritos O instrumento de notação Codificação e dicionário das variáveis Data view e variable view Introdução

Leia mais

(a) Teste e IC para Duas Variâncias. (b) Teste para médias. Duas Amostras de Teste T e IC

(a) Teste e IC para Duas Variâncias. (b) Teste para médias. Duas Amostras de Teste T e IC Exercício 1 Contexto: amostras independentes de populações normais (a) Teste e IC para Duas Variâncias Método Hipótese nula Variância(Primeiro) / Variância(Segundo) = 1 Hipótese alternativa Variância(Primeiro)

Leia mais

Análise de Variância a um factor

Análise de Variância a um factor 1 Análise de Variância a um factor Análise de experiências com vários grupos de observações classificados através de um só factor (por exemplo grupos de indivíduos sujeitos a diferentes tratamentos para

Leia mais

Métodos Experimentais em Ciências Mecânicas

Métodos Experimentais em Ciências Mecânicas Métodos Experimentais em Ciências Mecânicas Professor Jorge Luiz A. Ferreira Pertencem ao grupo de ferramentas estatísticas que permitem caracterizar um conjunto de dados sob ponto de vista da tendência

Leia mais

BIOESTATÍSTICA. Análise de regressão

BIOESTATÍSTICA. Análise de regressão BIOESTATÍSTICA Análise de regressão Análise de correlação Existe uma associação estatística entre duas variáveis? As duas variáveis são independentes ( ou seja, qual o grau da variação das duas juntas)?

Leia mais

Avaliação Monte Carlo do teste para comparação de duas matrizes de covariâncias normais na presença de correlação

Avaliação Monte Carlo do teste para comparação de duas matrizes de covariâncias normais na presença de correlação Avaliação Monte Carlo do teste para comparação de duas matrizes de covariâncias normais na presença de correlação Vanessa Siqueira Peres da Silva 1 2 Daniel Furtado Ferreira 1 1 Introdução É comum em determinadas

Leia mais

7 Análise dos Dados e Cálculos

7 Análise dos Dados e Cálculos 71 7 Análise dos Dados e Cálculos 7.1 Validade dos Processos Estocásticos 7.1.1 Teste de Dickey-Fuller De início, para verificar a rejeição de hipótese de que as séries seguem um MGB foi realizado um teste

Leia mais

BIOESTATÍSTICA TESTES DE HIPÓTESES

BIOESTATÍSTICA TESTES DE HIPÓTESES BIOESTATÍSTICA TESTES DE HIPÓTESES O QUE É HIPÓTESE? PALAVRA GREGA (ὑπόθεσις ) QUE SIGNIFICA BASE, FUNDAMENTO, PRINCÍPIO DE ALGO, PROPOSIÇÃO. DEFINIÇÃO: PROPOSIÇÃO QUE SE ADMITE, INDEPENDENTEMENTE DO FATO

Leia mais

Bioestatística. Paulo Nogueira quarta-feira, 11 de Janeiro de 2012

Bioestatística. Paulo Nogueira quarta-feira, 11 de Janeiro de 2012 Bioestatística Paulo Nogueira quarta-feira, 11 de Janeiro de 2012 Bioestatística? Bioestatística Biologia + Estatística (Portmanteau) Biometria Estatística aplicada às ciências da saúde Para que serve

Leia mais

Introdução à análise estatística com SPSS. Guião nº6: Medidas de associação

Introdução à análise estatística com SPSS. Guião nº6: Medidas de associação Introdução à análise estatística com SPSS Guião nº6: Medidas de associação Experiência sobre volume plasmático e o peso em 13 homens saudáveis Os investigadores pretendem descobrir se as variáveis volume

Leia mais

REGRESSÃO LOGÍSTICA E INDICADORES DE GOVERNANÇA GLOBAL

REGRESSÃO LOGÍSTICA E INDICADORES DE GOVERNANÇA GLOBAL PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO FEA Faculdade de Economia e Administração Programa de Estudos Pós Graduados em Administração REGRESSÃO LOGÍSTICA E INDICADORES DE GOVERNANÇA GLOBAL Disciplina:

Leia mais

INTRODUÇÃO. Exemplos. Comparar três lojas quanto ao volume médio de vendas. ... ANÁLISE DE VARIÂNCIA. Departamento de Matemática ESTV.

INTRODUÇÃO. Exemplos. Comparar três lojas quanto ao volume médio de vendas. ... ANÁLISE DE VARIÂNCIA. Departamento de Matemática ESTV. INTRODUÇÃO Exemplos Para curar uma certa doença existem quatro tratamentos possíveis: A, B, C e D. Pretende-se saber se existem diferenças significativas nos tratamentos no que diz respeito ao tempo necessário

Leia mais

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO FEA - Faculdade de Economia e Administração Programa de Estudos Pós-Graduados em Administração METODOS

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO FEA - Faculdade de Economia e Administração Programa de Estudos Pós-Graduados em Administração METODOS PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO FEA - Faculdade de Economia e Administração Programa de Estudos Pós-Graduados em Administração METODOS TRABALHO FINAL PROJETO ORIBER Tema 6. O FUTURO DA EDUCAÇÃO

Leia mais

Associação entre duas variáveis

Associação entre duas variáveis Associação entre duas variáveis Questões de interesse: Será que duas variáveis são independentes ou pelo contrário dependentes? E se forem dependentes, qual o tipo e grau de dependência? Existem diversas

Leia mais

Eng a. Morgana Pizzolato, Dr a. Aula 02 Revisão de Estatística DPS1037 SISTEMAS DA QUALIDADE II ENGENHARIA DE PRODUÇÃO CT/UFSM

Eng a. Morgana Pizzolato, Dr a. Aula 02 Revisão de Estatística DPS1037 SISTEMAS DA QUALIDADE II ENGENHARIA DE PRODUÇÃO CT/UFSM Eng a. Morgana Pizzolato, Dr a. Aula 02 Revisão de Estatística DPS1037 SISTEMAS DA QUALIDADE II ENGENHARIA DE PRODUÇÃO CT/UFSM TÓPICOS DESTA AULA Revisão de Estatística Coleta de dados Análise de dados

Leia mais

CONHECIMENTOS ESPECÍFICOS

CONHECIMENTOS ESPECÍFICOS CONHECIMENTOS ESPECÍFICOS 2003 2004 2005 2006 2007 2008 2009 2010 X 39,0 39,5 39,5 39,0 39,5 41,5 42,0 42,0 Y 46,5 65,5 86,0 100,0 121,0 150,5 174,0 203,0 A tabela acima mostra as quantidades, em milhões

Leia mais

Estatística Descritiva (II)

Estatística Descritiva (II) Estatística Descritiva (II) Exemplo: Um experimento feito por alunos. Cada um deles registrou sua altura, peso, sexo, hábito de fumar e nível de atividade física. Depois, todos eles jogaram moedas e aqueles

Leia mais

Explorando os dados. Estatística Descritiva - Tabelas. Roteiro da aula. Tabelas

Explorando os dados. Estatística Descritiva - Tabelas. Roteiro da aula. Tabelas Explorando os dados Estatística Descritiva: Medidas de tendência central e medidas de dispersão Um leitão médio num rebanho bem manejado poderá apresentar um ganho médio de a gramas, do nascimento à desmama.

Leia mais

ÍNDICE. Variáveis, Populações e Amostras. Estatística Descritiva PREFÁCIO 15 NOTA À 3ª EDIÇÃO 17 COMO USAR ESTE LIVRO? 21 CAPÍTULO 1 CAPÍTULO 2

ÍNDICE. Variáveis, Populações e Amostras. Estatística Descritiva PREFÁCIO 15 NOTA À 3ª EDIÇÃO 17 COMO USAR ESTE LIVRO? 21 CAPÍTULO 1 CAPÍTULO 2 COMO USAR ESTE LIVRO ÍNDICE PREFÁCIO 15 NOTA À 3ª EDIÇÃO 17 COMO USAR ESTE LIVRO? 21 CAPÍTULO 1 Variáveis, Populações e Amostras 1.1. VARIÁVEIS ESTATÍSTICAS E ESCALAS DE MEDIDA 27 1.2. POPULAÇÃO VS. AMOSTRA

Leia mais

Estatística Computacional (Licenciatura em Matemática) Duração: 2h Frequência NOME:

Estatística Computacional (Licenciatura em Matemática) Duração: 2h Frequência NOME: DEPARTAMENTO DE MATEMÁTICA DA UNIVERSIDADE DE COIMBRA Estatística Computacional (Licenciatura em Matemática) Duração: 2h Frequência 24-05-2011 NOME: Observação: A resolução completa das perguntas inclui

Leia mais

([DPHGH5HFRUUrQFLDGH0pWRGRV(VWDWtVWLFRV

([DPHGH5HFRUUrQFLDGH0pWRGRV(VWDWtVWLFRV Data: 09/07/2003 ([DPHGH5HFRUUrQFLDGH0pWRGRV(VWDWtVWLFRV Duração: 2 horas Nome: N.º: Curso: Regime: Número de folhas suplementares entregues pelo aluno: Declaro que desisto (VWDSURYDFRQVLVWHHPTXHVW}HVGHUHVSRVWDDEHUWDHDVUHVSHFWLYDVFRWDo}HVHQFRQWUDPVHQDWDEHODTXHVHVHJXH

Leia mais

Inferência Estatística Estimação de Parâmetros

Inferência Estatística Estimação de Parâmetros Inferência Estatística Estimação de Parâmetros Pedro Paulo Balestrassi www.pedro.unifei.edu.br ppbalestrassi@gmail.com 35-36291161 / 88776958 (cel) 1 Inferência Estatística: uma amostra ajudando a entender

Leia mais

AULA 07 Inferência a Partir de Duas Amostras

AULA 07 Inferência a Partir de Duas Amostras 1 AULA 07 Inferência a Partir de Duas Amostras Ernesto F. L. Amaral 10 de setembro de 2012 Faculdade de Filosofia e Ciências Humanas (FAFICH) Universidade Federal de Minas Gerais (UFMG) Fonte: Triola,

Leia mais

Métodos Estatísticos Avançados em Epidemiologia

Métodos Estatísticos Avançados em Epidemiologia Universidade Federal de Minas Gerais Instituto de Ciências Exatas Departamento de Estatística Métodos Estatísticos Avançados em Epidemiologia Aula 2-2 Regressão de Poisson: Modelando Contagens Distribuição

Leia mais

Técnicas Computacionais em Probabilidade e Estatística I. Aula III

Técnicas Computacionais em Probabilidade e Estatística I. Aula III Técnicas Computacionais em Probabilidade e Estatística I Aula III Chang Chiann MAE 5704- IME/USP 1º Sem/2008 1 Arquivo PULSE do Minitab Refere-se a um experimento feito por alunos. Cada um deles registrou

Leia mais