Modelagem conjunta da média e variância utilizando GLM

Documentos relacionados
O problema da superdispersão na análise de dados de contagens

O problema da superdispersão na análise de dados de contagens

DEFINIÇÃO - MODELO LINEAR GENERALIZADO

MODELAGEM CONJUNTA DE MÉDIA E VARIÂNCIA EM EXPERIMENTOS FRACIONADOS SEM REPETIÇÃO UTILIZANDO GLM

3 Metodologia de Avaliação da Relação entre o Custo Operacional e o Preço do Óleo

DIAGNÓSTICO EM MODELOS LINEARES GENERALIZADOS

MODELOS DE REGRESSÃO PARAMÉTRICOS

Modelo linear normal com erros heterocedásticos. O método de mínimos quadrados ponderados

Modelo linear clássico com erros heterocedásticos. O método de mínimos quadrados ponderados

3 A técnica de computação intensiva Bootstrap

UNIDADE IV DELINEAMENTO INTEIRAMENTE CASUALIZADO (DIC)

Variação ao acaso. É toda variação devida a fatores não controláveis, denominadas erro.

Regressão Múltipla. Parte I: Modelo Geral e Estimação

REGRESSÃO NÃO LINEAR 27/06/2017

É o grau de associação entre duas ou mais variáveis. Pode ser: correlacional ou experimental.

Prof. Lorí Viali, Dr.

1. CORRELAÇÃO E REGRESSÃO LINEAR

5 Análise Conjunta da Média e da Dispersão

4 Critérios para Avaliação dos Cenários

EFEITOS DE DISPERSÃO EM PROJETOS FATORIAIS: UMA SIMULAÇÃO CONFIRMATÓRIA

2 Incerteza de medição

Prof. Lorí Viali, Dr.

Associação entre duas variáveis quantitativas

Métodos de identificação de efeitos na dispersão em experimentos fatoriais não replicados

Programa do Curso. Sistemas Inteligentes Aplicados. Análise e Seleção de Variáveis. Análise e Seleção de Variáveis. Carlos Hall

DELINEAMENTOS EXPERIMENTAIS

Análise de influência

UMA ABORDAGEM ALTERNATIVA PARA O ENSINO DO MÉTODO DOS MÍNIMOS QUADRADOS NO NÍVEL MÉDIO E INÍCIO DO CURSO SUPERIOR

Métodos Avançados em Epidemiologia

Prof. Lorí Viali, Dr.

Os modelos de regressão paramétricos vistos anteriormente exigem que se suponha uma distribuição estatística para o tempo de sobrevivência.

Aplicação de um modelo simulado na formação de fábricas

RAD1507 Estatística Aplicada à Administração I Prof. Dr. Evandro Marcos Saidel Ribeiro

Modelagem da proporção de produtos defeituosos usando Modelo de Quase-verossimilhança

Análise Exploratória de Dados

Universidade de São Paulo Escola Superior de Agricultura Luiz de Queiroz Departamento de Ciências Exatas

SÍNTESE DA MODELAGEM CONJUNTA DA MÉDIA E DISPERSÃO DE NELDER E LEE PARA APLICAÇÃO À METODOLOGIA DE TAGUCHI

Cap. 11 Correlação e Regressão

MOQ-14 PROJETO e ANÁLISE de EXPERIMENTOS. Professor: Rodrigo A. Scarpel

UNIVERSIDADE DE PERNAMBUCO. Física Experimental. Prof o José Wilson Vieira

Reconhecimento Estatístico de Padrões

EXERCÍCIO: VIA EXPRESSA CONTROLADA

Curso de extensão, MMQ IFUSP, fevereiro/2014. Alguns exercício básicos

Regressão Linear Simples by Estevam Martins

Análise de Regressão

Gráficos de Controle para Processos Autocorrelacionados

Capítulo 1. Exercício 5. Capítulo 2 Exercício

5 Métodos de cálculo do limite de retenção em função da ruína e do capital inicial

ANÁLISE DA VARIÂNCIA DA REGRESSÃO

PRESSUPOSTOS DO MODELO DE REGRESSÃO

MOQ-14 PROJETO e ANÁLISE de EXPERIMENTOS. Professor: Rodrigo A. Scarpel

Testes não-paramétricos

Estatística II Antonio Roque Aula 18. Regressão Linear

O USO DA METODOLOGIA DE SUPERFÍCIE DE RESPOSTA PARA ADEQUAR OS PARÂMETROS DE ENTRADA DE UM ALGORITMO GENÉTICO

Ao se calcular a média, moda e mediana, temos: Quanto mais os dados variam, menos representativa é a média.

Figura 8.1: Distribuição uniforme de pontos em uma malha uni-dimensional. A notação empregada neste capítulo para avaliação da derivada de uma

AULA EXTRA Análise de Regressão Logística

Capítulo 2. Modelos de Regressão

Estudo e Previsão da Demanda de Energia Elétrica. Parte II

Métodos Experimentais em Ciências Mecânicas

ESTUDO DE MODELOS PARA AJUSTE E PREVISÃO DE UMA SÉRIE TEMPORAL

NOÇÕES SOBRE CORRELAÇÃO E REGRESSÃO LINEAR SIMPLES

MOQ-14 PROJETO e ANÁLISE de EXPERIMENTOS. Professor: Rodrigo A. Scarpel

Ao se calcular a média, moda e mediana, temos: Quanto mais os dados variam, menos representativa é a média.

Análise Exploratória de Dados

6 Análises de probabilidade de ruptura de um talude

MODELO DE ALOCAÇÃO DE RECURSOS ENTRE AS INSTITUIÇÕES FEDERAIS DE ENSINO SUPERIOR: UMA APLICAÇÃO DOS MODELOS LINEARES GENERALIZADOS

O PROBLEMA DA MODELAGEM DA VARIÂNCIA NA OTIMIZAÇÃO EXPERIMENTAL DE PRODUTOS OU PROCESSOS

Análise de Regressão Linear Múltipla VII

Departamento de Produção, UNESP, Campus de Guaratinguetá Av. Ariberto Pereira da Cunha, 333, Guaratinguetá, S.P. CEP

4.1. Variáveis de Resposta

REGRESSÃO E CORRELAÇÃO

MOQ-14 PROJETO E ANÁLISE DE EXPERIMENTOS LISTA DE EXERCÍCIOS 1 REGRESSÃO LINEAR SIMPLES

Cap. IV Análise estatística de incertezas aleatórias

Análise de Regressão Linear Múltipla IV

CAPÍTULO 2 DESCRIÇÃO DE DADOS ESTATÍSTICA DESCRITIVA

RISCO. Investimento inicial $ $ Taxa de retorno anual Pessimista 13% 7% Mais provável 15% 15% Otimista 17% 23% Faixa 4% 16%

Análise de Regressão. Profa Alcione Miranda dos Santos Departamento de Saúde Pública UFMA

ALGORITMOS PARA DADOS AUMENTADOS

Modelagem do crescimento de clones de Eucalyptus via modelos não lineares

1. ANÁLISE EXPLORATÓRIA E ESTATÍSTICA DESCRITIVA

5 Implementação Procedimento de segmentação

Eventos coletivamente exaustivos: A união dos eventos é o espaço amostral.

7 - Distribuição de Freqüências

Contabilometria. Aula 8 Regressão Linear Simples

CORRELAÇÃO E REGRESSÃO

É o grau de associação entre duas ou mais variáveis. Pode ser: correlacional. ou experimental.

R X. X(s) Y Y(s) Variáveis aleatórias discretas bidimensionais

Classificação de Padrões

Problemas de engenharia

Experiência V (aulas 08 e 09) Curvas características

3 Algoritmos propostos

Departamento de Informática. Modelagem Analítica do Desempenho de Sistemas de Computação. Modelagem Analítica. Disciplina: Variável Aleatória

3.6. Análise descritiva com dados agrupados Dados agrupados com variáveis discretas

SELEÇÃO DE MODELOS VOLUMÉTRICOS PARA CLONES DE EUCALYPTUS SPP., NO PÓLO GESSEIRO DO ARARIPE

Universidade Federal do Paraná Departamento de Informática. Reconhecimento de Padrões. Classificadores Lineares. Luiz Eduardo S. Oliveira, Ph.D.

8.2. Tipos de Ações Gerenciais em Empresas que Valorizam o Controle de Qualidade

Transcrição:

XXIV Encontro Nac. de Eng. de Produção - Floranópols, SC, Brasl, 03 a 05 de nov de 004 Modelagem conjunta da méda e varânca utlzando GLM Patríca Klaser Basol ( UFRGS ) patybasol@producao.ufrgs.br Flávo Sanson Foglatto ( UFRGS ) ffoglatto@producao.ufrgs.br Resumo A modelagem conjunta de méda e varânca tem se mostrado partcularmente relevante na obtenção de processos e produtos robustos. Nesse contexto, deseja-se mnmzar a varabldade das respostas smultaneamente com o ajuste dos fatores, tal que se obtenha a méda da resposta próxma ao valor alvo. Nos últmos anos foram desenvolvdos dversos procedmentos de modelagem conjunta de méda e varânca, dentre eles a utlzação do GLM e de projetos fatoras fraconados. O objetvo deste artgo é revsar o estado-da-arte da bblografa sobre projetos fatoras fraconados e GLM, bem como apresentar uma síntese da metodologa de modelagem conjunta da méda e varânca apresentada por Nelder e Lee (1998), lustrada através de um exemplo numérco. Palavras chave: GLM, Fatoral fraconado, Modelagem conjunta de méda e varânca 1. Introdução A modelagem conjunta da méda e varânca têm se mostrado bastante útl no contexto atual de mercado, onde exgêncas por otmzação de produtos e processos, redução dos custos e melhora da qualdade e produtvdade se fazem crescentes. Essa modelagem é utlzada para otmzar a varável de resposta, e, assm, obter processos e produtos robustos. Nela, deseja-se mnmzar a varabldade das respostas smultaneamente com o ajuste dos fatores, de forma a se obter a méda da varável de resposta próxma a um valor alvo pré-determnado. Nos últmos anos foram desenvolvdos dversos procedmentos de modelagem conjunta de méda e varânca, dentre eles a utlzação de GLM (Generalzed Lnear Models Modelos Lneares Generalzados) e de projetos fatoras fraconados. A necessdade da modelagem do efeto de fatores de controle sobre a varabldade das varáves de resposta fo orgnalmente proposta por Taguch, no contexto de planejamentos robustos (TAGUCHI et al., 1990). A proposta de Taguch, à parte sua relevânca hstórca, fo objeto de crítcas, já que resulta em expermentos com um grande número de rodadas e com matrzes expermentas onde a mportânca das nterações entre os fatores controláves é desconsderada (GUNTER, 1987; BOX, 1988). Com o ntuto de aperfeçoar a proposta de modelagem conjunta de méda e varânca ncalmente desenvolvda por Taguch, alguns autores sugerram procedmentos baseados na utlzação de projetos fatoras fraconados, com dados modelados através de GLM. Esse trabalho tem como objetvo revsar o estado-da-arte da lteratura sobre projetos fatoras fraconados e sobre a modelagem va GLM. Além dsso, são apresentadas dferentes propostas de modelagem conjunta da méda e varânca e suas respectvas crítcas, conforme apresentadas na lteratura. Por fm, apresenta-se um exemplo numérco para lustrar os concetos teórcos abordados. No restante deste trabalho, o efeto dos fatores de um projeto expermental sobre a meda será desgnado por efeto de localzação e o efetos dos fatores sobre a varânca será desgnado por efeto de dspersão. ENEGEP 004 ABEPRO 1597

XXIV Encontro Nac. de Eng. de Produção - Floranópols, SC, Brasl, 03 a 05 de nov de 004. Referencal Teórco Nesta seção é apresentada uma ntrodução aos projetos fatoras fraconados e aos modelos lneares generalzados (GLM). O objetvo é fornecer uma base teórca para a compreensão das modelagens apresentadas e exemplfcadas nas demas seções deste trabalho. Um projeto fatoral m k completo requer que todas as combnações de m níves de k fatores sejam testadas expermentalmente (BOX; HUNTER, 000). Assm, o número de ensaos aumenta rapdamente à medda que aumenta o número de fatores. Por exemplo, uma repetção completa de um fatoral 6 requer 64 ensaos. Dos 63 graus de lberdade dsponíves neste exemplo, apenas 1 correspondem a efetos prncpas e nterações de 1 a ordem; os demas correspondem a nterações de maor ordem, usualmente de dfícl nterpretação físca. Box et al. (1978) demonstram que os efetos em um expermento possuem certa herarqua. Assm, é razoável supor que nterações de maor ordem não sejam sgnfcatvas, o que permtra obter nformações acerca dos efetos prncpas e nterações de baxa ordem a partr de uma fração do expermento fatoral completo. Um projeto com essas característcas é denomnado projeto fatoral fraconado. Um projeto fatoral m k fraconado é usualmente desgnado por m k-p, onde p ndca o grau de fraconamento. Fatoras fraconados são utlzados em dferentes crcunstâncas. Por exemplo, quando se assume a pror que algumas nterações não são sgnfcatvas ou quando se deseja dentfcar quas varáves têm nfluênca sob a varável resposta, sem um maor detalhamento sobre a forma do efeto (BOX; HUNTER, 000). De forma smplfcada, o procedmento para defnr projetos fraconados consste em dvdr o projeto completo em dos ou mas blocos, confundndo uma ou mas nterações de ordem superor com fatores prncpas ou nterações de menor ordem. Posterormente, executa-se apenas um dos blocos, escolhdo aleatoramente. Termos confunddos devdo ao fraconamento estarão vnculados, e não permtrão dstngur o efeto de dos ou mas fatores na análse dos dados. Assm, recomenda-se que efetos mportantes sejam vnculados a nterações de ordem superor e não sgnfcatva. Dados orundos de projetos fraconados são tpcamente analsados somente quanto há efeto dos fatores de controle sobre a méda da varável de resposta, já que a ausênca de replcações das rodadas expermentas dfculta a modelagem do efeto de fatores de controle sobre a varânca. A partr do trabalho semnal de Box e Meyer (1986), dversos autores propuseram procedmentos para a modelagem da méda e varânca da varável resposta a partr de dados orundos de projetos fraconados; tas procedmentos são dscutdos mas adante neste artgo. Modelos lneares e não lneares são baseados na suposção de que as varáves de resposta são normalmente dstrbuídas, o que nem sempre se verfca na prátca. Os modelos lneares generalzados (GLMs), desenvolvdos por Nelder e Wedderburn (197), permtem o ajuste de modelos de regressão quando a varável resposta pertencer à famíla exponencal de dstrbuções, que contempla, além da dstrbução Normal, as dstrbuções Bnomal, Geométrca, Bnomal Negatva, Exponencal, Gamma e Normal Inversa. Além dsso, tas modelos admtem não-homogenedade na varânca da varável de resposta. Todas as dstrbuções pertencentes à famíla exponencal possuem a mesma função de densdade de probabldade, defnda como f ( y; θ, φ) = exp{ yθ b( θ) a( φ) + c( y, φ) }, onde a(.), b(.) e c(.) são funções específcas; o parâmetro θ é o parâmetro de localzação natural ou canônco e φ é freqüentemente desgnado como parâmetro de dspersão ou escala. O parâmetro de escala φ é suposto conhecdo para cada observação (CORDEIRO, 1986). A função a ( φ ) é a forma generalzada de a ( φ ) φ.w =, onde w é um peso conhecdo a pror. Modelos de GLM são defndos por 3 componentes: dstrbução da varável resposta, predtor ENEGEP 004 ABEPRO 1598

XXIV Encontro Nac. de Eng. de Produção - Floranópols, SC, Brasl, 03 a 05 de nov de 004 lnear e função de lgação. Tas componentes são detalhados a segur. Dstrbução da varável resposta: os GLMs podem ser utlzados quando se tem uma únca varável resposta Y e, assocado a ela, um conjunto de varáves explcatvas x1, x,..., x k. Consderam-se y 1, y,..., y n observações ndependentes da varável Y, com médas µ 1, µ,..., µ n. As observações y são aleatóras (componente aleatóro do GLM) e seguem uma dstrbução pertencente à famíla exponencal (MYERS et al., 00), com um parâmetro desconhecdo e com méda de uma dstrbução de probabldade pertencente a famíla exponencal (CORDEIRO, 1986). Além dsso, assume-se que exste apenas um termo de erro no modelo (MCCULLAGH; NELDER, 1983) e que a varânca σ ( = 1,,..., n) é função da méda µ (MYERS et al., 00). Predtor lnear: os regressores (varáves explcatvas) x 1, x,..., x k entram no modelo na forma de uma soma lnear, dando orgem ao vetor de predtores lneares (vetor das médas k µ ), que é a porção sstemátca do modelo, defnda como η = x β = β0 + βx, onde η, chamado predtor lnear, é um vetor 1 β ( ) n ; ' = ( x x ) = 1 x 1,..., k é um vetor de regressores e = β1, β,..., β k ' é um vetor de k parâmetros a serem estmados, onde k < n. A função lnear η dos parâmetros em β chama-se predtor lnear (CORDEIRO, 1986). Função de Lgação: o GLM é encontrado através da função de lgação η g ( µ ) =, = 1,,..., n., onde g (). é a função de lgação utlzada. Esta função faz a lgação entre a méda (componente aleatóro) e o predtor lnear (porção sstemátca do modelo), por meo de ' uma função conhecda g ()., ou seja, g ( µ ) = η =xβ (MYERS et al., 00), onde x é o vetor das varáves regressoras para a -ésma observação; e β é o vetor de parâmetros desconhecdos ou coefcentes de regressão. A função de lgação g() é responsável pela transformação da méda da população, e não dos dados (COSTA, 003). Exstem dversas possbldades de escolha da função de lgação; entretanto, essa escolha depende do problema de modelagem em partcular e, pelo menos em teora, cada observação pode apresentar uma função de lgação dferente. Se a função de lgação seleconada for gual ao parâmetro de localzação da dstrbução ( η = θ ), o predtor lnear modela dretamente o parâmetro canônco θ e a função de lgação η é denomnada de lgação canônca (MCCULLAGH; NELDER, 1983). Segundo Cordero (1986), o parâmetro canônco caracterza uma dstrbução de probabldade membro da famíla exponencal. Lgações canôncas para dstrbuções de probabldade usuas são apresentadas na Tabela 1. 3. Propostas para a Modelagem conjunta de Méda e Varânca A lteratura apresenta dversas propostas para a modelagem de méda e varânca a partr de dados orundos de expermentos fraconados. A prmera, e uma das mas referencadas por outros autores, fo desenvolvda por Box e Meyer (1986). Os autores propõem dentfcar os efetos de localzação através do papel de probabldade da Normal. Posterormente, deve-se realzar um expermento fatoral completo com repetção dos fatores com efeto sobre a méda da varável de resposta. Depos de elmnar esses efetos de localzação através do cálculo das estmatvas e analsando os resíduos, o planejamento pode ser reexamnado para detectar efetos de dspersão atvos. O termo elmnar efetos, será utlzado nesse trabalho para defnr o procedmento de dentfcação dos efetos e ncorporação destes em outro modelo, neste caso, para a varânca. ENEGEP 004 ABEPRO 1599

XXIV Encontro Nac. de Eng. de Produção - Floranópols, SC, Brasl, 03 a 05 de nov de 004 Dstrbução Lgação Canônca Normal η = µ Lgação dentdade Bnomal η = ln( P (1 P)) Lgação logístca Posson η = ln( µ ) Lgação logarítmca Exponencal η = 1 µ Lgação recíproca Gamma η = 1 µ Lgação recíproca Fonte: Myers, Montgomery e Vnng (00) Tabela 1: Funções de Lgação Canônca para algumas dstrbuções de probabldade Essa metodologa fornece uma manera econômca de dentfcar um pequeno número de efetos de localzação e dspersão sgnfcatvos. Depos de ajustar o modelo, Box e Meyer (1986) recomendam a estmação por mínmos quadrados para um ajuste mas precso e apresentam estes estmadores em seu trabalho. Nelder e Lee (1998) consderam que ferramentas gráfcas são muto útes, mas deveram ser utlzadas com métodos mas formas desde o nco da análse. Se apenas métodos gráfcos são utlzados, mportantes efetos ntermedáros podem ser desconsderados. Rbero et al. (001) propõem uma modelagem conjunta smplfcada da méda e varânca, baseada na proposta de Box e Meyer (1986), para expermentos fatoras fraconados sem repetção. Essa proposta modela a varânca das respostas usando os resíduos do modelo de regressão para a resposta méda, sem a repetção dos tratamentos. O procedmento consste em verfcar se resíduos de um nível de um fator controlável dferem sgnfcatvamente dos de outro nível; em caso afrmatvo, a varânca da resposta é dada pelos resíduos e pode ser modelada como função desse fator. As prncpas dferenças entre o método proposto pelos autores e o de Box e Meyer (1986) são: () Box e Meyer (1986) fornecem meos para ncorporar nterações nos modelos de varânca; entretanto, Rbero et al. (001) consderam que os benefícos de consderar termos de alta ordem são dúbos, pos, na prátca, geralmente efetos de alta ordem não são sgnfcatvos e tornam o modelo mas complexo, além de demandarem mutos dados, não dsponíves no caso de expermentos fraconados; () Box e Meyer (1986) determnam a sgnfcânca dos termos a serem ncluídos no modelo através de análse vsual, dferente do método em Rbero et al. (001); e () o método em Box e Meyer (1986) é restrto a projetos fatoras fraconados do tpo k. Segundo McGrath e Ln (001), é necessáro utlzar repetções para fazer a modelagem conjunta de méda e varânca quando se utlzam dados de projetos fatoras fraconados. Isso ocorre porque, se o modelo para a méda não nclur todos os termos sgnfcatvos, tas termos podem erroneamente aparecer como sgnfcatvos na modelagem da varânca se o procedmento de Box e Meyer (1986) for adotado. Em outras palavras, os efetos de localzação devem ser estudados e ncorporados ao modelo da méda antes do estudo da varânca, pos a dentfcação do efeto da varânca é sensível ao modelo ajustado para a méda. Em McGrath e Ln (001), assm como em Box e Meyer (1986), recomenda-se que os efetos de localzação sejam prmeramente dentfcados e, posterormente, que sejam utlzados os resíduos do modelo da méda para dentfcar os efetos de dspersão. McGrath e Ln (001) também apresentam um detalhamento da análse em Box e Meyer (1986) e dervam uma relação explícta entre os efetos de localzação e dspersão. Estudos prelmnares dos autores mostram que o efeto de dspersão produz correlação entre um par de efetos de localzação. A análse dessa correlação pode ajudar a remover o confundmento entre efetos da méda e da varânca. Wolfnger e Tobas (1998) propõem a modelagem conjunta dos efetos aleatóros, de localzação e de dspersão utlzando modelos mstos e assumndo normaldade dos resíduos. ENEGEP 004 ABEPRO 1600

XXIV Encontro Nac. de Eng. de Produção - Floranópols, SC, Brasl, 03 a 05 de nov de 004 Modelos mstos são usualmente utlzados quando os dados envolvem alguma estrutura de blocos que afeta a covarânca entre as observações (ou seja, exste uma varável que dstngue dos grupos). Além da desvantagem do pressuposto de normaldade dos resduos, modelos mstos não permtem detectar pequenos efetos de localzação na presença de grandes efetos de dspersão. Por fm, um modelo msto complexo não pode, em alguns casos, ser ajustado a um conjunto pequeno de dados extremamente fraconados. Nelder e Lee (1998), analsando os objetvos da metodologa de Taguch, propuseram a modelagem conjunta da méda e da varânca utlzando os modelos lneares generalzados. Em sua proposta, os autores utlzavam-se de dos GLMs nterlgados, um para méda e um para a varânca. A estrutura de nterlgação desses modelos vem lustrada na Tabela. Na tabela observa-se que o componente de desvo do modelo para a méda se torna a resposta do modelo para a varânca, e que o nverso dos valores ajustados no modelo para a varânca fornecem os pesos a pror para o modelo da méda. Componente Modelo para méda Modelo para a Varânca Resposta Y d Méda µ φ Varânca φ V ( µ ) Função de Lgação η g ( µ ) φ = ζ = logφ Predtor Lnear η = x jβ j ζ = zkγ k y / Componente do Desvo d = ( y u) V ( u) du { log ( d φ ) + ( d φ) / φ} µ Peso a pror 1 φ 1 Fonte: Nelder e Lee (1998) Tabela : Componentes do Modelo Conjunto da Méda e Varânca O algortmo de modelagem conjunta da méda e varânca proposto por Nelder e Lee (1998) pode ser resumdo da segunte forma: Var Y = φ V µ : observa-se que a varânca se 1. Identfcação da função da varânca ( ) ( ) dvde em duas partes, φ que é chamado de parâmetro de dspersão (o qual é ndependente da méda) e V ( µ ), que é uma função de varânca, que descreve a varânca como função da méda.. Modelagem conjunta da méda e varânca: deve-se escolher a função de lgação aproprada juntamente com as covaráves no predtor lnear para ajustar um modelo saturado, pelo método da máxma verossmlhança estendda. Pnto e Leon (003) sugerem o gráfco proposto por Box (1988) como ferramenta exploratóra para determnar a função de lgação. 3. Verfcação do Modelo: A otmzação dos parâmetros dos modelos para a méda e varânca é conduzda através do método dos mínmos quadrados reponderados teratvamente (IRWLS teratvely reweghted least squares). Se o modelo for consderado não adequado, deve-se voltar ao passo 1. ENEGEP 004 ABEPRO 1601

XXIV Encontro Nac. de Eng. de Produção - Floranópols, SC, Brasl, 03 a 05 de nov de 004 Após a defnção do modelo, deve-se obter os níves ótmos para os parâmetros. Prmeramente deve-se mnmzar a varabldade, encontrando os conjuntos ótmos de fatores controlados, depos ajusta-se a méda próxma ao valor alvo. A aplcação do GLM apresenta uma sére de vantagens, segundo Nelder e Lee (1998). O GLM utlza toda a nformação dos dados; assm, a análse da varânca resulta em uma resposta para cada observação, assm como a da méda. Qualquer tpo de dados (com dstrbução pertencente à famíla exponencal), pode ser usado na modelagem va GLM não havendo a necessdade de fazer transformação dos dados para estes aderrem a dstrbução Normal. 4. Exemplo Numérco de Modelagem Conjunta de Méda e Varânca utlzando GLM O exemplo apresentado a segur lustra a modelagem conjunta da méda e varânca utlzando GLM, segundo a proposta de Nelder e Lee (1998), tendo sdo orgnalmente apresentado em Pnto e Leon (003). Os dados, apresentados na Tabela 3, se referem a uma mstura para bolo a ser lançada no mercado. O produto precsa ser robusto a condções nadequadas de cozmento, representadas pelos fatores de processo temperatura do forno (x 4 ) e tempo de forneamento (x 5 ). Os fatores controlados no expermento são quantdade de farnha (x 1 ), quantdade de açúcar (x ) e quantdade de ovos (x 3 ). O planejamento expermental consste em um fatoral 3, com um ponto central, para os fatores controláves, cruzado com um fatoral, mas um ponto central para os fatores de processo. Os níves zero dos fatores correspondem as condções deas de cozmento sugerdas pelo fabrcante. A varável de resposta medda é o índce de predleção (uma característca do tpo maor-é-melhor). Pode-se observar, analsando o conjunto de dados, que os ensaos 7 e 9 produzem msturas menos suscetíves a varações nos fatores de processo; entretanto, o ensao 7 tem a méda mas alta de predleção sendo, assm, a melhor mstura para lançamento no mercado. Aparentemente, essa análse nformal é sufcente para extrar nformações mportantes; contudo, em expermentos mas complexos, uma análse mas sofstcada se faz necessára. Para este exemplo, Pnto e Leon (003) seguram o mesmo procedmento descrto em Engel e Huele (1996), ou seja, consderaram Y = ( y1,..., y n ) como sendo o vetor contendo observações da varável de resposta; x 1,..., x k como sendo os k fatores controláves e r 1,..., r q como q fatores de processo. Seja ( ) f x a -ésma lnha da matrz de planejamento = 1,..., n. A matrz de planejamento pode conter efetos lneares, quadrátcos e nterações. Os níves dos fatores de processo na lnha são denotados por r. Fatores controláves Fatores de processo N x 4 0-1 1-1 1 Ensao x 1 x x 3 x 5 0-1 -1 1 1 1 0 0 0 6,7 3,4 5,4 4,1 3,8-1 -1-1 3,1 1,1 5,7 6,4 1,3 3 1-1 -1 3, 3,8 4,9 4,3,1 4-1 1-1 5,3 3,7 5,1 6,7,9 5 1 1-1 4,1 4,5 6,4 5,8 5, 6-1 -1 1 5,9 4, 6,8 6,5 3,5 7 1-1 1 6,9 5,0 6,0 5,9 5,7 8-1 1 1 3,0 3,1 6,3 6,4 3,0 9 1 1 1 4,5 3,9 5,5 5,0 5,4 Fonte: Pnto e Leon (003) Tabela 3: Dados do exemplo de mstura para bolo ENEGEP 004 ABEPRO 160

XXIV Encontro Nac. de Eng. de Produção - Floranópols, SC, Brasl, 03 a 05 de nov de 004 O objetvo é obter um modelo para E( Y ), a méda, e para ( ) Var Y, a varânca assocada à varável de resposta. Durante o expermento, o vetor Y é observado condconalmente aos µ = E y r e níves dos fatores de processo. Assm, prmeramente deve-se defnr ( ) σ = Var ( y r). O modelo de regressão proposto para o problema é: y µ ε ε ~ N ( 0, σ ). = +, onde A méda condconal µ é lnear nos conjuntos de fatores de processo na lnha, onde T T µ = β0 + g ( x) β+ r δ+ g ( x) Λ r, sendo β 0 uma constante, β e δ vetores dos parâmetros e Λ a matrz que contém os coefcentes de regressão das nterações entre os fatores T σ = exp u γ. controlados e de processo. A varânca condconal é modelada como ( ) Como E( y r) processo. Da mesma forma, a função de varânca Var ( y r) µ =, tem-se o valor esperado da resposta condconado aos fatores de σ = é uma resposta para a varânca também condconada aos fatores de processo. Pode-se encontrar E ( y ) e Var ( y ). da segunte forma: E ( y) = E E( y rì) e Var ( y) = Var E ( y r) + E Var ( y r) Essa modelagem fo realzada supondo uma dstrbução Normal e utlzando a função de lgação dentdade para o modelo da méda, e dstrbução Gamma e função de lgação logarítmca para o modelo da varânca. Pnto e Leon (003) mplementaram o algortmo de modelagem conjunta proposto por Nelder e Lee (1998) utlzando a lnguagem de programação FORTRAN. A matrz de planejamento com as colunas: 1, x1, x, x3, x4, x5, xx 1 4, xx 1 5, xx 3, xx 4, xx 5, xx 3 4, xx, 3 5 fo utlzada para modelar a méda e a varânca. O programa convergu após 6 terações, obtendo os seguntes modelos para a méda e varânca, respectvamente: ˆ µ = 4, 699 + 0, 456x3 0, 69xx 3 e ˆ σ = exp( 0,744x 1 ). Sendo assm, ˆ E( Y ) = ˆ µ e Var ˆ ( Y ) = ˆ σ, pos nenhuma nteração com fatores de processo fo sgnfcatva em ambos modelos. Assm, para que a varânca seja mínma, x 1 = 1. Para que a méda seja a mas alta possível, x = 1 e x 3 = 1. Logo, a melhor combnação possível dos fatores controláves é 1, -1 e 1, correspondendo exatamente ao ensao número 7 (ver Tabela 3). 5. Consderações Fnas A aplcação dos modelos de regressão tradconas utlza o método dos Mínmos Quadrados Ordnáros e Máxma Verossmlhança para estmação de seus parâmetros. Tas metodologas pressupõem varânca constante e esta suposção está dretamente relaconada com a suposção de normaldade das respostas. Entretanto, sabe-se que tas suposções são frequentemente voladas na prátca, já que nem todos os fenômenos podem ser bem modelados supondo dstrbução Normal. Fo demonstrado neste artgo que o GLM pode ser uma alternatva para tas stuações, pos permte modelar dados orundos de dstrbuções de probabldade pertencentes a famíla exponencal, a qual engloba dstrbuções dscretas, assmétrcas e bnomas, entre outras. Nos últmos anos foram desenvolvdos dversos procedmentos de modelagem conjunta de méda e varânca com o ntuto de aperfeçoar os métodos desenvolvdos por Taguch. ENEGEP 004 ABEPRO 1603

XXIV Encontro Nac. de Eng. de Produção - Floranópols, SC, Brasl, 03 a 05 de nov de 004 Dversos autores consderam que os métodos de Taguch nem sempre são claros e efcentes, e apresentam alternatvas de modelagem conjunta, dentre elas a utlzação do GLM e de projetos fatoras fraconados. A modelagem utlzando GLM fo lustrada através de um exemplo numérco utlzando uma rotna computaconal em FORTRAN. A fm de facltar a compreensão das modelagens ctadas e desenvolvdas na lteratura, o trabalho apresentou uma revsão bblográfca sobre projetos fatoras fraconados e GLM. Uma lnha futura de nvestgação sera propor uma heurístca que permta a aplcação da modelagem conjunta da méda e varânca utlzando GLM através de um software estatístco, tal como o GLIM. Referêncas BOX, G. E. P. Sgnal to nose, performance crtera and transformatons. Technometrcs, v.30, Issue 1,p.1-17, February, 1988. BOX, G. E. P.; HUNTER, J.S. The k-p Fractonal Factoral Desgns, Part I. Technometrcs, v. 4, Issue 1, p.8-48, February, 000. BOX, G. E. P.; HUNTER, W. G.; HUNTER, J. S. Statstcs for Experments An Introduton to Desgn, Data Analyss and Model Buldng. New York: John Wley & Sons, 1978. BOX, G. E. P.; MEYER, R. D. Dsperson Effects from Fractonal Desgns. Technometrcs, v. 8, Issue 1, p.19-7. February, 1986. CORDEIRO, G.M. Análse Estatístca de dados através do sstema GLIM. Mncurso 1. XXI Smpóso Braslero de Pesqusa Operaconal, 1989. COSTA, S. C. Modelos Lneares Generalzados Mstos para Dados Longtudnas. Praccaba-SP; ESALQ/USP, 003. Tese (Doutorado em Agronoma), Escola Superor de Agrcultura Luz de Queroz, Unversdade de São Paulo, 003. ENGEL, J.; HUELE, A. F. A Generalzad Lnear Modelng Approach to Robust Desgn. Technometrcs, v.38, Issue 4, p.365-373, November, 1996. GUNTER, B. A. A Perspectve on Taguch Methods. Qualty Process, v. 0, Issue 6, p.44-5, June, 1987. MCGRATH, R. N.; LIN, D. K. Confoundng of Locaton and Dsperson Effects n Unreplcated Fractonal Factorals. Journal of Qualty Technology, v. 33, Issue, p.19-139, Aprl, 001. McCULLAGH, P. ; NELDER, J. A. Generalzed Lnear Models. London-New York: Chapman and Hall, 1983. MEYER, R. H.; MONTGOMERY, D. C. A Tutoral on Generalzed Lnear Models. Journal of Qualty Technology, v.9, Issue 3, p.74-91, July, 1997. MYERS, R. H.; MONTGOMERY, D. C.; VINING, G. G. Generalzed Lnear Models Wth Applcatons n Engneerng and the Scences. New York: John Wley & Sons, 00. NELDER, J. A.; LEE, Y. Letters to the Edtor Jont Modelng of Mean and Dsperson. Technometrcs, v.40, Issue, p.168-171, May, 1998. NELDER, J. A.; WEDDERBURN, R. W. M. Generalzed Lnear Models. Journal of the Royal Statstcal Socety. Seres A, v. 135, p. 370-84, 197. PINTO, E. R.; LEON, A. C. M. P. Síntese da Modelagem Conjunta da méda e dspersão de Nelder e Lee para aplcação à metodologa de Taguch. In. XXXV Smpóso Braslero de Pesqusa Operaconal (SOBRAPO), 003, Natal, RN. Anas. Aguardando Publcação. RIBEIRO, J. L. D; FOGLIATTO, F. S.; CATEN, C. S. Mnmzng Manufacturng and Qualty Costs n Multresponse Optmzaton. Qualty Engneerng, v. 13, Issue, p.191-01, 001. TAGUCHI, G.; ELSAYED, E. A.; HSIANG, T. C. Traduzdo por LOVERRI, R. C. Engenhara da Qualdade em Sstemas de Produção. São Paulo: McGraw-Hll, 1990. WOLFINGER, R. D.; TOBIAS, R. D. Jont Estmaton of Locaton, Dsperson, and Random Effects n Robust Desgn. Technometrcs, v. 40, Issue 1, p.6-71, February, 1998. ENEGEP 004 ABEPRO 1604