MODELO DE ALOCAÇÃO DE RECURSOS ENTRE AS INSTITUIÇÕES FEDERAIS DE ENSINO SUPERIOR: UMA APLICAÇÃO DOS MODELOS LINEARES GENERALIZADOS

Documentos relacionados
O problema da superdispersão na análise de dados de contagens

O problema da superdispersão na análise de dados de contagens

3 Metodologia de Avaliação da Relação entre o Custo Operacional e o Preço do Óleo

Os modelos de regressão paramétricos vistos anteriormente exigem que se suponha uma distribuição estatística para o tempo de sobrevivência.

MODELOS DE REGRESSÃO PARAMÉTRICOS

4 Critérios para Avaliação dos Cenários

DIAGNÓSTICO EM MODELOS LINEARES GENERALIZADOS

1. CORRELAÇÃO E REGRESSÃO LINEAR

Modelo linear normal com erros heterocedásticos. O método de mínimos quadrados ponderados

3 A técnica de computação intensiva Bootstrap

Métodos Avançados em Epidemiologia

DEFINIÇÃO - MODELO LINEAR GENERALIZADO

Estatística II Antonio Roque Aula 18. Regressão Linear

Modelo linear clássico com erros heterocedásticos. O método de mínimos quadrados ponderados

REGRESSÃO NÃO LINEAR 27/06/2017

UNIDADE IV DELINEAMENTO INTEIRAMENTE CASUALIZADO (DIC)

Regressão Múltipla. Parte I: Modelo Geral e Estimação

UMA ABORDAGEM ALTERNATIVA PARA O ENSINO DO MÉTODO DOS MÍNIMOS QUADRADOS NO NÍVEL MÉDIO E INÍCIO DO CURSO SUPERIOR

2 Incerteza de medição

NOÇÕES SOBRE CORRELAÇÃO E REGRESSÃO LINEAR SIMPLES

Curso de extensão, MMQ IFUSP, fevereiro/2014. Alguns exercício básicos

Cap. 11 Correlação e Regressão

SELEÇÃO DE MODELOS VOLUMÉTRICOS PARA CLONES DE EUCALYPTUS SPP., NO PÓLO GESSEIRO DO ARARIPE

Variação ao acaso. É toda variação devida a fatores não controláveis, denominadas erro.

CAPÍTULO 2 DESCRIÇÃO DE DADOS ESTATÍSTICA DESCRITIVA

Associação entre duas variáveis quantitativas

Modelagem do crescimento de clones de Eucalyptus via modelos não lineares

AULA EXTRA Análise de Regressão Logística

Análise de influência

UNIVERSIDADE DE PERNAMBUCO. Física Experimental. Prof o José Wilson Vieira

Prof. Lorí Viali, Dr.

3 Algoritmos propostos

3.6. Análise descritiva com dados agrupados Dados agrupados com variáveis discretas

Regressão Linear Simples by Estevam Martins

DELINEAMENTOS EXPERIMENTAIS

RISCO. Investimento inicial $ $ Taxa de retorno anual Pessimista 13% 7% Mais provável 15% 15% Otimista 17% 23% Faixa 4% 16%

7 - Distribuição de Freqüências

PRESSUPOSTOS DO MODELO DE REGRESSÃO

Contabilometria. Aula 8 Regressão Linear Simples

Modelo Logístico. Modelagem multivariável com variáveis quantitativas e qualitativas, com resposta binária.

CORRELAÇÃO E REGRESSÃO

Estudo quantitativo do processo de tomada de decisão de um projeto de melhoria da qualidade de ensino de graduação.

Análise Exploratória de Dados

É o grau de associação entre duas ou mais variáveis. Pode ser: correlacional ou experimental.

Algarismos Significativos Propagação de Erros ou Desvios

5 Implementação Procedimento de segmentação

Análise de Variância. Comparação de duas ou mais médias

Aula Características dos sistemas de medição

Capítulo 1. Exercício 5. Capítulo 2 Exercício

Estatística I Licenciatura MAEG 2006/07

ANÁLISE DA VARIÂNCIA DA REGRESSÃO

UMA VALIDAÇÃO MATEMÁTICA PARA UM ALGORITMO QUE SIMULA MISTURAS DE DISTRIBUIÇÕES

Análise de Regressão Linear Múltipla VII

MOQ-14 PROJETO E ANÁLISE DE EXPERIMENTOS LISTA DE EXERCÍCIOS 1 REGRESSÃO LINEAR SIMPLES

5 Métodos de cálculo do limite de retenção em função da ruína e do capital inicial

1. ANÁLISE EXPLORATÓRIA E ESTATÍSTICA DESCRITIVA

Figura 8.1: Distribuição uniforme de pontos em uma malha uni-dimensional. A notação empregada neste capítulo para avaliação da derivada de uma

Testes não-paramétricos

Análise de Regressão. Profa Alcione Miranda dos Santos Departamento de Saúde Pública UFMA

Cap. IV Análise estatística de incertezas aleatórias

Modelagem da proporção de produtos defeituosos usando Modelo de Quase-verossimilhança

INTRODUÇÃO À CALIBRAÇÃO MULTIVARIADA

RAD1507 Estatística Aplicada à Administração I Prof. Dr. Evandro Marcos Saidel Ribeiro

EXERCÍCIO: VIA EXPRESSA CONTROLADA

5 Análise Conjunta da Média e da Dispersão

Prof. Lorí Viali, Dr.

METOLOGIA. 1. Histórico

6 Análises de probabilidade de ruptura de um talude

Gráficos de Controle para Processos Autocorrelacionados

Classificação de Padrões

Psicologia Conexionista Antonio Roque Aula 8 Modelos Conexionistas com tempo contínuo

UM PROBLEMA ECONOMÉTRICO NO USO DE VARIÁVEIS CLIMÁTICAS EM FUNÇÕES DE PRODUÇÃO AJUSTADAS A DADOS EXPERIMENTAIS

Programa do Curso. Sistemas Inteligentes Aplicados. Análise e Seleção de Variáveis. Análise e Seleção de Variáveis. Carlos Hall

Capítulo 2. APROXIMAÇÕES NUMÉRICAS 1D EM MALHAS UNIFORMES

Dados ajustáveis a uma linha recta

2 Metodologia de Medição de Riscos para Projetos

Programa de Certificação de Medidas de um laboratório

Avaliação do tamanho da amostra de segmentos regulares para estimar a área plantada com café na região sul de Minas Gerais

Estatística Espacial: Dados de Área

MODELAGEM CONJUNTA DE MÉDIA E VARIÂNCIA EM EXPERIMENTOS FRACIONADOS SEM REPETIÇÃO UTILIZANDO GLM

TESTE DO QUI-QUADRADO - Ajustamento

Identidade dos parâmetros de modelos segmentados

ÍNDICE DE CONSISTÊNCIA TEMPORAL: UM NOVO MÉTODO PARA AVALIAÇÃO DA ESTABILIDADE TEMPORAL DE ARMAZENAMENTO DE ÁGUA NO SOLO

Capítulo 2. Modelos de Regressão

Ao se calcular a média, moda e mediana, temos: Quanto mais os dados variam, menos representativa é a média.

MOQ-14 PROJETO e ANÁLISE de EXPERIMENTOS. Professor: Rodrigo A. Scarpel

Ao se calcular a média, moda e mediana, temos: Quanto mais os dados variam, menos representativa é a média.

ESTUDO DE MODELOS PARA AJUSTE E PREVISÃO DE UMA SÉRIE TEMPORAL

Eventos coletivamente exaustivos: A união dos eventos é o espaço amostral.

CÁLCULO DO ALUNO EQUIVALENTE PARA FINS DE ANÁLISE DE CUSTOS DE MANUTENÇÃO DAS IFES

Variável discreta: X = número de divórcios por indivíduo

5 Relação entre Análise Limite e Programação Linear 5.1. Modelo Matemático para Análise Limite

INSTITUTO POLITÉCNICO DE VISEU ESCOLA SUPERIOR DE TECNOLOGIA E GESTÃO

PROVA DE ESTATÍSTICA & PROBABILIDADES SELEÇÃO MESTRADO/UFMG 2010/2011

Análise Exploratória de Dados

MOQ-14 PROJETO e ANÁLISE de EXPERIMENTOS. Professor: Rodrigo A. Scarpel

Transcrição:

MODELO DE ALOCAÇÃO DE RECURSOS ENTRE AS INSTITUIÇÕES FEDERAIS DE ENSINO SUPERIOR: UMA APLICAÇÃO DOS MODELOS LINEARES GENERALIZADOS Getúlo José Amorm AMARAL 1 Gauss Moutnho CORDEIRO 2 RESUMO: Neste artgo desenvolve-se um modelo lnear generalzado para explcar o orçamento de custeo e captal (OCC) das nsttuções federas de ensno superor (IFES) do Brasl. Neste modelo, a transformação de Box e Cox (1964) é usada para encontrar a melhor função de varânca e o conceto de quase-verossmlhança permte defnr e estmar o modelo assocado a esta função de varânca. Além dsto, o quase-desvo estenddo é usado para comparar o modelo de quase-verossmlhança escolhdo com uma outra alternatva de nteresse. PALAVRAS-CHAVE: Modelos econométrcos; função de quase-verossmlhança; quase-desvo estenddo. 1 Introdução O Mnstéro da Educação (MEC) tem utlzado um modelo consttuído por três componentes: custos, hstórco e produção, para dstrbur os recursos de orçamento de custeo e captal (OCC) entre as IFES. A prncpal parcela deste modelo é aquela assocada aos custos, que é calculada por um modelo de mínmos quadrados. Especfcamente, a varável resposta deste modelo é defnda por: POCC: Percentuas de alocação de OCC em relação ao total de todas as IFES, e suas varáves explcatvas: ACECB: Alunos matrculados nos cursos das áreas de conhecmento das cêncas exatas e da terra e cêncas bológcas; AENG: Alunos matrculados nos cursos da área de conhecmento de engenhara; ACS: Alunos matrculados nos cursos das área de conhecmento das cêncas da saúde; ACAGR : Alunos matrculados nos cursos das área de conhecmento das cêncas agráras; ACSH: Alunos matrculados nos cursos das áreas de conhecmento das cêncas socas aplcadas e cêncas humanas, letras e artes; 1 Departamento de Estatístca, Centro de Cêncas Exatas e da Natureza, Unversdade Federal de Pernambuco - UFPE, Cdade Unverstára, CEP: 50740-540, Recfe, Pernambuco, Brasl. E-mal: getulo_amaral@hotmal.com 2 Departamento de Físca e Matemátca, Unversdade Federal Rural de Pernambuco - UFRPE. CEP: 52171-900, Recfe, Pernambuco, Brasl. E-mal: gausscordero@uol.com.br Rev. Mat. Estat., São Paulo, v.21, n.2, p.55-69, 2003 55

SGRA: Alunos matrculados nos cursos de prmero e segundo graus não técncos; TEC: Alunos matrculados nos cursos de segundo grau técncos; AREA: Área construída atual arredondada para o ntero mas próxmo; CAP: Percentuas relatvos aos gastos de captal, nclundo recursos própros. Todas as varáves são tomadas como a méda dos últmos cnco anos anterores ao ano de mplementação do modelo, com exceção da área construída, que é ncorporada ao modelo com o seu valor atual. Nas varáves ACECB, AENG, ACS, ACAGR e ACSH são ncluídos todos os cursos de graduação, mestrado e doutorado. Os valores destas 10 varáves, para as 52 IFES, relatvos ao ano de 1994, são apresentados na Tabela 1. O índce de custos correspondente a -ésma unversdade é estmado pela equação POCC = B 1 ACECB + B 2 AENG +... + B 9 CAP, onde os coefcentes B 1, B 2,...,B 9 são estmados pelo método dos mínmos quadrados. A pressuposção de varânca constante do método de mínmos quadrados não é adequada aos dados em questão. A déa do método é encontrar estmatvas dos parâmetros B 1, B 2,...,B 9 de modo que o somatóro dos quadrados das dstâncas entre cada ponto observado e seu valor estmado pelo modelo seja mínma. Dessa forma, o método atrbu pesos guas às observações, o que equvale a supor que a varânca da varável POCC é constante. Porém, por outro lado, as unversdades são muto heterogêneas e, portanto, a suposção de varabldade constante para a varável POCC não é adequada. Dessa forma, o objetvo deste artgo é propor um modelo estatístco que substtua adequadamente o modelo de mínmos quadrados usado no componente de custos. 2 Modelos lneares generalzados Os modelos lneares generalzados (MLGs) foram formulados por Nelder e Wedderburn (1972) e representam a unfcação de classes de modelos que eram estudadas separadamente. T Nos MLGs as varáves aleatóras y = ( y 1,..., y n ) são supostas ndependentes e cada y tem uma densdade ou função de probabldade na famíla exponencal ndexada por θ f ( y φ, θ ) = exp[ { yθ b( θ )} a( φ ) + c( y, φ )], ( 1) a, b (.), e (.,.) ; onde (.) suposto conhecdo para cada observação. c são funções conhecdas e o parâmetro de precsão > 0 Tem-se E ( y ) = db( θ ) dθ = µ e Var( y ) a( φ ) V, µ uma função conhecda da méda. φ é = onde V = dµ dθ é 56 Rev. Mat. Estat., São Paulo, v.21, n.2, p.57-71, 2003

Tabela 1 - Dados das unversdades N Unversdade Sgla POCC ACECB AENG ACS ACAGR ACSH SGRA TEC CAP AREA 1 Unv. Fed. de Alagoas UFAL 2,1720 485 1497 2021 554 4246 0 0 1,3784 124002 2 Unv. Fed. Baha UFBA 3,8479 2223 2080 3123 994 7892 0 0 3,6460 211250 3 Unv. Fed. do Ceará UFCE 3,8147 1633 1292 2582 1345 6180 0 0 2,6433 225330 4 Unv. Fed. Espírto Santo UFES 2,3758 687 1368 1451 129 4827 402 0 3,1463 146642 5 Unv. Fed. Goás UFGO 2,3466 903 711 2110 793 5124 766 0 1,6032 158099 6 Unv. Fed. Flumnense UFF 4,0567 2464 2370 3510 594 13124 0 290 4,1598 212325 7 Unv. Fed. de Juz De Fora UFJF 1,6517 452 879 2466 0 2677 1940 0 1,6464 115734 8 Unv. Fed. de Mnas Geras UFMG 4,2200 2302 2973 4958 777 8253 749 819 7,7363 644445 9 Unv. Fed. do Pará UFPA 3,7424 3784 2129 2326 0 10865 3251 0 2,7999 167110 10 Unv. Fed. da Paraíba UFPB 3,9552 2209 3646 2857 1165 9406 422 0 2,0738 516612 11 Unv. Fed. do Paraná UFPR 3,7409 2132 2319 4100 1104 5882 0 556 7,1304 370012 12 Unv. Fed. de Pernambuco UFPE 3,8344 1443 2400 3402 0 9630 293 0 7,8266 325745 13 Unv. Fed. Ro Grande do Norte UFRN 3,0532 1193 1204 1983 118 6872 328 0 1,9043 275621 14 Unv. Fed. do Ro Grande do Sul UFRGS 3,9878 2776 3025 3020 1017 9318 532 961 5,1540 281434 15 Unv. Fed. do Ro de Janero UFRJ 6,8590 3767 5146 4655 0 12547 244 0 4,0843 468000 16 Unv. Fed. de Santa Catarna UFSC 3,4910 1250 2984 2348 559 6896 1095 147 2,9753 187477 17 Unv. Fed. de Santa Mara UFSM 2,7492 748 910 2441 1660 3713 0 775 2,0606 246271 18 Unv. Fed. Rural de Pernambuco UFRPE 1,2035 1814 0 284 3879 677 0 666 0,5584 86887 19 Unv. Fed. Rural do Ro de Janero UFRRJ 1,2893 504 322 204 2187 801 0 335 0,9369 160647 20 Fund. Unv. Fed. de Rorama FUFRR 0,5098 466 61 0 30 1481 0 180 0,2366 12180 21 Fac. de C. Agraras do Pará FCAPA 0,4841 0 0 0 1190 0 0 0 0,2871 40321 22 Fac. Medcna Trângulo Mnero FMTM 0,7832 0 0 716 0 0 0 101 0,5980 21002 23 Fac Odontologa de Damantna FAOD 0,1816 0 0 182 0 0 0 0 0,1069 7879 24 Cefet - Ro de Janero CEFET-RJ 0,6049 0 917 0 0 0 2314 3320 0,4432 101560 25 Cefet - Mnas Geras CEFET-MG 0,5769 0 456 0 0 78 0 3880 0,7602 36151 26 Cefet - Paraná CEFET-PR 0,7652 301 1143 0 100 565 0 6710 2,3396 132572 (Contnua) Rev. Mat. Estat., São Paulo, v.21, n.2, p.55-69, 2003 57

(Contnuação) N Unversdade Sgla POCC ACECB AENG ACS ACAGR ACSH SGRA TEC CAP AREA 27 Centec - Baha CEFET-BA 0,3519 0 702 0 0 127 0 3240 0,2147 45879 28 Esc. Farmáca e Odont. Alfenas EFOA 0,4053 0 0 864 0 0 0 0 0,2228 20306 29 Esc. Fed. Engenhara de Itajubá EFEI 0,5577 0 1606 0 0 0 0 0 0,4452 63580 30 Esc. Paulsta de Medcna UNIFESP 3,2161 214 0 2135 0 55 0 0 1,5227 137573 31 Esc. Sup. Agrc. de Lavras UFLA 0,6510 0 0 0 1871 198 0 0 0,6848 55861 32 Esc. Sup. de Agrc. de Mossoró ESAM 0,3133 0 0 0 405 0 0 0 0,1880 100721 33 Fund. Unv. Fed. de Rondôna FUFRO 0,4959 166 0 196 0 1840 0 0 0,2598 10458 34 Fund. Unv. do Ro de Janero UNIRIO 1,4315 536 0 2067 0 1649 0 0 1,2411 29136 35 Fund. Unv. do Amazonas FUAM 2,0987 1169 710 1136 265 4725 0 0 1,4401 80560 36 Fund. Unv. de Brasíla UNB 2,9535 1878 1102 1267 452 6234 0 0 6,0008 500148 37 Fund. Unv. do Maranhão UFMA 1,9745 1021 309 1460 0 4857 1942 0 2,4121 111777 38 Fund. Unv. do Ro Grande FURG 1,1987 380 677 834 116 2658 0 0 1,5317 60733 39 Fund. Unv. Fed. de Uberlânda FUFUB 2,7714 649 1485 1259 563 4151 1035 0 3,2862 170221 40 Fund. Unv. Fed. do Acre FUFAC 0,7321 531 144 192 220 1854 398 0 0,3537 35330 41 Fund. Unv. Fed. de Mato Grosso FUFMT 1,8048 1378 822 882 526 5617 0 0 3,0294 333584 42 Fund. Unv. Fed. de Ouro Preto FUOP 0,9174 281 816 642 0 450 0 0 0,8062 98864 43 Fund. Unv. Fed. de Pelotas FUFPEL 1,8829 171 0 1536 1491 2540 1045 0 1,6335 115464 44 Fund. Unv. Fed. do Pauí UFPI 1,7422 780 352 1473 827 3880 40 0 1,0139 56808 45 Fund. Unv. Fed. de São Carlos FUSCAR 1,1157 1301 1179 299 38 399 0 0 2,2792 107632 46 Fund. Unv. Fed. de Sergpe UFSE 1,3536 787 477 1135 30 4346 277 0 0,7122 118679 47 Fund. Unv. Fed. de Vçosa FUFV 1,9605 754 301 368 2921 1409 1665 287 1,2162 271453 48 Fund. Unv. Fed. Mato Grosso Sul FUFMS 1,7582 1278 391 990 366 3681 0 0 0,7620 170081 49 Fund. Fac. C. Medcas P. A. FFCMPA 0,8535 0 0 970 0 0 0 0 0,0516 11518 50 Fund. Ens. Sup. S. João Del Re FUNREI 0,4298 122 1158 0 0 1684 0 0 0,3932 20787 51 Fund. Unv. Fed. do Amapá FUFAP 0,4245 86 0 45 0 668 0 0 0,0298 5000 52 Cefet- Maranhão CEFET-MA 0,3083 0 54 0 0 0 0 0 0,0330 27969 Fonte: Assocação Naconal dos Drgentes das Insttuções Federas de Ensno Superor (Andfes) 58 Rev. Mat. Estat., São Paulo, v.21, n.2, p.57-71, 2003

Consdera-se que as co-varáves, x, uma estrutura lnear dada por sendo X ( x,, ) 1 x p x onde x ( x, x ),, 1 p j = produzem η = Xβ, ( 2) = uma matrz conhecda e β = ( β,, )T um conjunto de 1 j 1 β p parâmetros desconhecdos. A conexão entre a méda de cada observação com o predtor lnear do modelo é feta pela função de lgação g( µ ) = η, = 1,, n. ( 3 ) O modelo lnear generalzado é defndo pelas componentes ( 1 ), ( 2 ) e ( 3 ). Nesta classe de modelos o vetor de parâmetros β é estmado pelo método da máxma verossmlhança, ou seja, pela maxmzação do logartmo da função de verossmlhança n ( β ) = f ( ; θ, φ ). = 1 A dscrepânca de um ajustamento é medda pela função desvo. Para defnr essa função supondo-se n observações, sejam ( ˆ; µ y) o máxmo da log-verossmlhança para o modelo em estudo com p parâmetros e ( y; y) o modelo saturado com n parâmetros. Usando estas defnções, a função desvo é dada por y D( y; ˆ) µ / a( φ) = 2[ ( ˆ; µ y) ( y; y)]. nj T 3 Modelos de quase-verossmlhança Os MLGs permtem a resolução de város problemas que o modelo clássco de regressão não se aplca. De forma semelhante, os modelos de quase-verossmlhança (QV), desenvolvdos por Wedderburn (1974), podem ser utlzados em algumas stuações nas quas os MLGs não são adequados. Enquanto no MLG é necessáro especfcar a forma da dstrbução, que tem que pertencer à famíla exponencal, nos modelos de QV é necessáro especfcar apenas a relação entre a méda e a varânca da dstrbução. Dependendo da relação especfcada, a função de QV poderá se reduzr a uma log-verossmlhança. A função de QV é defnda por Q y t, µ = dt. ( 4 ) φv ( y ) µ y ( t) Assm, o modelo de QV é defndo pelo sstema ( 4 ), ( 2 ) e ( 3 ). De forma análoga aos MLGs, a função de quase-desvo é defnda por Rev. Mat. Estat., São Paulo, v.21, n.2, p.55-69, 2003 59

onde ( ) θ θ µ D ( y ) θ µ µ ( y t) V ( t) ; = 2 dt, y V µ = e os valores mas comuns de θ são 0, 1, 2 e 3, que estão assocados às dstrbuções normal, Posson, gama e normal nversa. Quando a função de quase-verossmlhança corresponde a uma funcão de verossmlhança, a dferença entre duas funções quase-desvo pode ser utlzada para avalar o ajuste de um modelo. Por outro lado, se esta correspondênca não ocorre, testes do tpo Wald e uma análse dos resíduos de Pearson são os procedmentos recomendados (vde McCullagh e Nelder, 1989). As funções desvo e quase-desvo não permtem comparar dferentes funções de varânca. Por causa dsto, Nelder e Pregbon (1987) apresentaram uma extensão da defnção orgnal de Wedderburn (1974), denomnado-a de quase-verossmlhança estendda, que é defnda por Q + 1 2 ( y; µ ) = log{ 2πφV ( y) } Dθ ( y; µ ) φ. A partr desta função, defne-se o quase-desvo estenddo por D + ( y; ) D ( y ; µ ) + log 2πφV ( y ) θ 1 2 n n 1 = θ { θ }, ( 5) φ µ = 1 = 1 que permte comparar dos modelos com funções de varânca dferentes. Quando a dstrbução de y não é naturalmente dentfcada, uma questão de grande nteresse que surge é: como encontrar a melhor função de varânca para um certo conjunto de dados? Isso pode ser feto a partr da transformação de Box e Cox (1964), que é defnda por y λ ( ) ( y 1) λ = log y λ, λ 0 λ = 0. Para sto, basta notar que a varânca da varável transformada y( λ) Var ( ( y ) = cµ 2 1 λ ), é dada por onde c é uma constante de proporconaldade. Portanto, para determnar a função de varânca mas adequada, é precso apenas encontrar o valor λ pelo método de Box e Cox e substtuí-lo em ( 6 ). Este procedmento é descrto por Francs; Green e Payne (1993). ( 6) 60 Rev. Mat. Estat., São Paulo, v.21, n.2, p.57-71, 2003

4 Desenvolvmento de um modelo estatístco para alocação de recursos entre as IFES A análse nca com a aplcação do modelo clássco de regressão aos dados em pauta. Em seguda, uma vez que a análse dos resíduos desse modelo ndca que o modelo não é adequado, outras alternatvas são analsadas. Na Subseção 4.1 é apresentada uma análse de regressão básca. Prmeramente, é feta uma análse a respeto do predtor lnear e são apresentados alguns crtéros para uma escolha que atenda às necessdades dos usuáros fnas do modelos, ou seja, os retores das IFES. Em seguda, é verfcado que o modelo clássco de regressão não é adequado aos dados. Fnalmente, algumas questões concetuas são apresentadas para explcar por que o modelo lnear generalzado com erro gama, que é uma das possvés alternatvas de modelagem conforme sugestão da lteratura, não é adequado ao conjunto de dados em pauta. A análse prossegue com o ajuste de modelos de quase-verossmlhança na Subseção 4.2, onde a metodologa descrta na Seção 3 é utlzada para a escolha da melhor função de varânca. Além dsso, é feta uma comparação, a partr do cálculo do quase-desvo estenddo, desse modelo com uma outra alternatva de nteresse. 4.1 Análse prelmnar Antes de ajustar o modelo clássco de regressão, fo realzada uma análse da estrutura de correlação entre as varáves explcatvas. A matrz de correlação entre as varáves do modelo, que é apresentada na Tabela 2, ndca uma forte correlação entre algumas das varáves explcatvas e uma correlação muto baxa entre as covaráves ACAGR, SGRA e TEC e a varável resposta POCC, evdencando que estas varáves explcatvas podem não ser relevantes para o modelo. Tabela 2 Matrz de correlação entre as varáves do modelo Covaráves POCC ACECB AENG ACS ACAGR ACSH SGRA TEC CAP ACECB 0,854 AENG 0,829 0,771 ACS 0,911 0,744 0,753 ACAGR 0,136 0,181-0,039 0,044 ACSH 0,895 0,881 0,812 0,829 0,017 SGRA 0,206 0,260 0,172 0,165-0,005 0,245 TEC -0,190-0,154 0,016-0,210-0,070-0,207 0,033 CAP 0,767 0,686 0,690 0,783 0,058 0,733 0,122-0,019 AREA 0,792 0,714 0,733 0,730 0,223 0,714 0,127-0,050 0,802 Uma vez que a multcolneardade pode provocar a exclusão do modelo de varáves explcatvas mportantes, alguns crtéros para a exclusão de varáves serão adotados. São consderadas relevantes as varáves explcatvas que representam um grupo específco de nsttuções. Por exemplo, a varável AENG é muto representatva para os Centros Federas Tecnológcos (CEFETs), pos nestes a atvdade de ensno está Rev. Mat. Estat., São Paulo, v.21, n.2, p.55-69, 2003 61

prncpalmente vnculada aos cursos de engenhara. Assm, essa varável não deve ser excluída do modelo, pos prejudcará os CEFETs. Para soluconar o problema supractado foram adotados os seguntes crtéros: a) As varáves explcatvas AREA e CAP podem ser retradas do modelo, pos não prejudcam nenhum grupo específco. Além dsso, como essas varáves estão muto correlaconadas com algumas das outras varáves explcatvas, a perda de nformação resultante, se essas co-varáves forem dentfcadas como não sgnfcatvas, é rrelevante; b) Com o objetvo de não prejudcar nenhum grupo específco de nsttuções, quando as co-varáves que representam o número de alunos de uma determnada área de conhecmento forem excluídas, estas sempre serão redefndas, para que nenhuma dessas seja elmnada da análse. Esses crtéros serão utlzados para determnar o predtor lnear de todos os modelos consderados neste artgo. O ajuste e análse do modelo clássco de regressão, que será chamado de Modelo 1, fornece um resultado muto bom. O predtor lnear fnal deste modelo possu apenas duas varáves explcatvas: ACS e OUTROS, onde a varável OUTROS corresponde a soma dos valores das varáves: ACECB, AENG, ACAGR, ACSH, SGRA e TEC. As estmatvas dos parâmetros e sua nterpretação serão apresentadas no fnal desta seção. O desvo do modelo é gual a 10,4, o que sgnfca que modelo pode ser aceto, pos este valor e bem nferor ao valor crítco de uma dstrbução de qu-quadrado com 49 graus de lberdade. Entretanto, o gráfco dos resíduos do Modelo 1, que é apresentado na Fgura 1, ndca que este não é um modelo adequado ao conjunto de dados em pauta. O gráfco dos valores ajustados e resíduos defndos como a raz quadrada dos desvos apresenta um comportamento sstemátco. Este comportamento ndca que a varânca dos resíduos é dretamente proporconal aos valores ajustados. Assm, a hpotése de varânca constante do Modelo 1 não é adequada. A nterpretação desse resultado é que a varabldade dos custos das grandes unversdades é maor do aquela das pequenas nsttuções de ensno superor. Outra alternatva analsada é o modelo lnear generalzado com erro gama, que não é aproprada do ponto de vsta concetual. As hpóteses desse modelo apresentam alguns problemas devdo ao fato da varável resposta ser uma porcentagem. A dstrbução gama é adequada para dados contínuos e postvos com um ntervalo de varação que pode ser lmtado. Uma vez que a varável resposta é lmtada, o modelo gama não é uma alternatva vável para descrever o comportamento desta varável. O ajuste do modelo gama a este conjunto de dados pode ser mplementado, porém em termos concetuas o modelo gama não é aproprado. Para o modelo gama ser adequado, este devera ter uma forma de ncorporar o lmte superor da varável resposta, que é gual a 1. Problema semelhante também ocorre com o Modelo 1. O conceto de quase-verossmlhança permte soluconar o problema concetual supractado com rgor centífco. Esse tpo de problema concetual fo ncalmente notado na lteratura dos MLGs por Wedderburn (1974). Este pesqusador apresentou, a partr da déa de modelos de quase-verossmlhança, uma justfcatva para procedmentos que eram usados nformalmente. No exemplo em questão, os resultados obtdos com o modelo gama são guas àqueles obtdos com o modelo de quase-verossmlhança, cuja função de varânca é proporconal ao quadrado da méda da varável resposta. Assm, o estatístco tem duas 62 Rev. Mat. Estat., São Paulo, v.21, n.2, p.57-71, 2003

opções: ser nformal, ajustando um modelo gama ao conjunto de dados das IFES, ou segur o rgor centífco, usando o modelo de quase-verossmlhança supractado. FIGURA 1 - Análse dos resíduos do Modelo 1. Fsher (1949) fo um dos prmeros a perceber que há stuações em que a dstrbução da varável resposta é dfclmente justfcada, o que fo destacado por Wedderburn (1974). Fsher (1949) utlzou a dstrbução de Posson para modelar uma varável resposta contínua, pos ele notou que a varânca dessa varável era proporconal à méda. Nesse caso, o conceto de quase-verossmlhança é útl para esclarecer as razões que levaram Fsher (1949) a adotar o modelo de Posson. 4.2 Análse dos modelos de quase-verossmlhança Uma vez que o modelo clássco de regressão e o modelo lnear generalzado com erro gama não descrevem o comportamento da varável resposta de forma satsfatóra, faz-se necessáro a utlzação de modelos de quase-verossmlhança. A formulação do modelo de quase-verossmlhança será feta a partr do procedmento descrto por Francs; Green e Payne (1993), que fo revsado na Seção 3. Na Tabela 3 são apresentados os resultados obtdos com a aplcação da metodologa de Box e Cox (1964) para a escolha da melhor transformação. Na mplementação desta metodologa é utlzada a macro BOXCOX, dsponível na bbloteca de macros do programa Generalzed Lnear Interactve Modellng (GLIM) (Baker, 1985). Os resultados obtdos demonstram que entre os valores de λ da Tabela 3, o melhor valor para λ é 0,5, pos esta escolha de λ corresponde ao menor valor do desvo, que é gual a 108,2. Se um outro Rev. Mat. Estat., São Paulo, v.21, n.2, p.55-69, 2003 63

ntervalo de valores para λ for seleconado de modo que a dferença entre estes seja menor e o ponto central seja 0,5, é possível encontrar um valor para λ próxmo a 0,5 e com o desvo menor do que 108,2. Entretanto, o valor seleconado para λ será 0,5, devdo a algumas razões teórcas que serão dscutdas a segur. Tabela 3 - Valores do desvo calculados para o parâmetro da transformação λ λ Desvo -3,0 547,7-2,5 461,5-2,0 379,9-1,5 304,7-1,0 238,0-0,5 181,5 0,0 136,8 0,5 108,2 1,0 109,3 1,5 149,4 2,0 212,7 2,5 283,9 3,0 357,6 Substtundo-se o valor de λ em ( 6 ), conclu-se que a função de varânca mas adequada é V ( µ ) = µ. Dessa forma, a função de QV assocada a esta função de varânca é dêntca a log-verossmlhança da Posson e, portanto, os dos modelos produzem as mesmas estmatvas para os parâmetros. Além dsso, procedmentos-padrão de verfcação do ajuste de modelos lneares generalzados podem ser usados, fato que fo comentado na Seção 3. O modelo de quase-verossmlhança escolhdo é coerente com as propredades do conjunto de dados em estudo. Se o valor do orçamento que cada nsttução recebe fosse um número ntero, a dstrbução da varável resposta sera mutnomal. Como a verossmlhança de respostas multnomas, com uma escolha adequada da função de lgação, é proporconal à verossmlhança de um MLG com respostas ndependentes com dstrbução de Posson, o resultado é coerente, sendo necessáro o uso do conceto de quaseverossmlhança, pos os valores da varável resposta não são nteros. Depos de determnar o componente ( 4 ) do modelo de QV, fo seleconada a função de lgação dentdade, pos esta fo a melhor opção dentre as alternatvas váves. Assm, o modelo de quase-verossmlhança com função de varânca ( V ( µ ) = µ ) e lgação dentdade, que será denomnado de Modelo 2, é ajustado com o uso das macros apresentadas a segur: 64 Rev. Mat. Estat., São Paulo, v.21, n.2, p.57-71, 2003

$MAC LIGA $CAL %FV=(%LP) $ENDMAC $MAC DER $CAL %DR=1 $ENDMAC $MAC VAR $CAL %VA=%FV $ENDMAC $MAC DES $CAL %DI=2*(%YV*%LOG(%YV/%FV)-(%YV-%FV)) $ENDMAC $OWN LIGA DER VAR DES $ $CALC %LP=%YV+0.5 $ As quatro prmeras lnhas de comandos do GLIM correspondem a defnção do modelo. Especfcamente, a função de lgação, função de varânca e a função desvo são defndas a partr das macros LIGA, VAR e DES, respectvamente. A macro DR representa a dervada da função de lgação em relação à méda das observações. As duas últmas lnhas do programa dão níco ao ajustamento do modelo defndo pelas macros LIGA, DER, VAR e DES. O Modelo 2 apresenta mutos aspectos postvos. Com um quase-desvo de 5,0, o modelo tem um excelente ajuste, pos esta estatístca é muto nferor ao ponto crítco de ququadrado com 49 graus de lberdade. Como era esperado, devdo à sua menor mportânca, a co-varável OUTROS tem o menor peso. Os alunos da área de saúde, representados por ACS, são os mas caros e possuem um peso que fca em torno de sete vezes do peso da co-varável OUTROS. Na Fgura 2 é apresentado o gráfco dos resíduos defndos como as raízes quadradas das componentes do desvo versus os valores ajustados, onde pode ser vsto que quase todos os pontos estão dentro de uma faxa de valores e, portanto, a função de varânca ( V ( µ ) = µ ) é adequada. Essa heterocedastcdade é coerente com os dados em pauta, pos as grandes unversdades não podem apresentar a mesma varabldade estocástca das pequenas unversdades. Nesta fgura percebe-se uma nsttução com o valor absoluto do resíduo superor aos valores absolutos dos resíduos das demas nsttuções. Porém, este ponto não pode ser consderado um ponto aberrante, pos o valor absoluto do resíduo é menor do que 1,96, o valor crítco de uma normal relatvo ao nível de 5% de confança. De qualquer forma, o valor absoluto elevado desse resíduo sgnfca que a nsttução correspondente, que é a Escola Paulsta de Medcna, recebeu hstorcamente um valor superor ao valor estmado pelo modelo, sto é, o valor estmado em função dos custos de todas as IFES. Além do modelo anteror, o ajuste do modelo com as mesmas co-varáves deste modelo e a função de varânca proporconal ao quadrado da méda, que resulta em uma quase-verossmlhança dêntca a log-verossmlhança do modelo gama, fornece um ajuste muto bom, com o quase-desvo de apenas 3,9027. Como este modelo, que será defndo como Modelo 3, é também uma boa alternatva, é precso fazer uma comparação entre este e o Modelo 2. Na Fgura 3 é apresentada uma lustração gráfca da comparação entre os Modelos 2 e 3. A varável relatva ao exo das ordenadas representa a dferença entre o valor de POCC estmado pelo Modelo 2 e aquele estmado pelo Modelo 3. O outro exo é referente ao valor observado de POCC. Dessa fgura, percebe-se que a escolha entre o Modelo 2 e 3 é uma decsão mportante, pos para algumas nsttuções a dferença entre o percentual estmado do orçamento pelo Modelo 2 e aquele estmado pelo Modelo 3 pode ser grande. Por exemplo, o valor máxmo dessa dferença ocorre para a nona observação, que é a Unversdade Federal Rev. Mat. Estat., São Paulo, v.21, n.2, p.55-69, 2003 65

do Pará, e corresponde a aproxmadamente 30% do valor hstórco do orçamento desta unversdade. FIGURA 2 - Análse dos resíduos do Modelo 2. FIGURA 3 - Comparação dos Modelos 2 e 3. 66 Rev. Mat. Estat., São Paulo, v.21, n.2, p.57-71, 2003

Para decdr, formalmente, qual dos dos modelos é melhor, é necessáro usar o quasedesvo estenddo defndo em ( 5 ), pos esses modelos possuem dferentes funções de varânca. Aplcando-se esta medda de dscrepânca aos Modelos 2 e 3 obtêm-se os resultados 42,73 e 46,48, respectvamente. Portanto, o Modelo 2 é o mas adequado para os dados em questão. As estmatvas e os desvos-padrão dos parâmetros dos Modelos 1, 2 e 3 são apresentadas na Tabela 4. Os coefcentes das varáves ACS e OUTROS representam suas respectvas contrbuções em relação ao percentual do orçamento que será destnado a cada uma das IFES. Supondo-se que o Modelo 2 é adotado para dstrbur os recursos entre as IFES, o peso da varável ACS será aproxmadamente sete vezes maor do que aquele da varável OUTROS. Assm, uma nsttução recebe por cada aluno da área de saúde aproxdamente sete vezes mas recursos do que o valor recebdo por cada aluno de outras áreas do conhecmento. Tabela 4 - Estmatvas dos parâmetros dos Modelos 1, 2 e 3 Coefcentes Termo constante ACS ACECB Modelo 1 Modelo 2 Modelo 3 0,316100 0,279300 0,270200 0,000625 0,000686 0,000695 0,000112 0,000105 0,000107 Desvos-Padrão Modelo 1 0,100900 0,000078 0,000018 Modelo 2 0,060470 0,000072 0,000016 Modelo 3 0,038670 0,000077 0,000015 Apesar dos valores dos parâmetros dos três modelos serem próxmos, os resultados fnas obtdos podem ser muto dferentes, sto é, se ocorrer uma mudança no modelo utlzado, o orçamento recebdo por uma nsttução pode mudar muto. Uma lustração deste fato fo apresentada na análse da Fgura 3, consderando-se o orçamento da Unversdade Federal do Pará. Além desses modelos, fo formulado um modelo a partr da técnca de componentes prncpas, que fo desenvolvdo pela necessdade de usar todas as varáves explcatvas na análse. Essa necessdade deve-se ao fato de que as varáves foram aprovadas em votação pelos retores das 52 IFES e, portanto, é mas convenente modfcar a forma de cálculo do que retrar alguma varável. Mas detalhes sobre este e os outros modelos são apresentados por Amaral (1997). Outra alternatva que também podera ser utlzada para resolver o problema de multcolneardade é a aplcação de transformações nas varáves explcatvas. Entretanto, essa alternatva dfclmente sera aceta pelos retores das IFES, tendo-se em vsta que o ponto de conflto do modelo é a determnação dos pesos da varáves. Uma vez que transformar a varável sera equvalente a mudar seu peso, o crtéro de ponderação não fcara claro. Rev. Mat. Estat., São Paulo, v.21, n.2, p.55-69, 2003 67

5 Comentáros fnas Todos os componentes de um modelo lnear generalzado devem ser cudadosamente verfcados. Assm, além dos testes usuas de ajustamento e de sgnfcânca dos parâmetros, a análse de resíduos e a verfcação das suposções teórcas do modelo são mprescndíves. Um modelo estatístco aplcado a problemas empresaras deve levar em conta as necessdades dos usuáros deste modelo para ser bem-suceddo. Em partcular, na análse apresentada, um modelo que exclu varáves explcatvas relatvas a um determnado tpo de aluno pode ser consderado dscrmnatóro. Portanto, os usáros fnas, que são os membros das unversdades, fcarão nsatsfetos com esse tpo de modelo, o que levará à sua rejeção. Os modelos de verossmlhança não são muto útes em stuações nas quas a suposção de que a varável resposta apresenta uma determnada dstrbução é dfclmente justfcada. Por exemplo, no problema consderado neste artgo, a suposção que uma proporção tem dstrbução gama ou Posson são hpóteses ncorretas. Por outro lado, o conceto de quase-verossmlhança, proposto por Wedderburn (1974), permte justfcar teorcamente alguns procedmentos que antes eram aplcados nformalmente, fato que é comentado no referdo artgo. Esta propredade é lustrada pelo uso do modelo de quase-verossmlhança com função de varânca proporconal ao quadrado da méda da varável resposta ao nvés do modelo lnear generalzado com erro gama. Os resultados obtdos pelos dos modelos são os mesmos, porém o modelo lnear generalzado com erro gama não é adequado do ponto de vsta concetual. Esse mesmo racocíno é aplcado na comparação entre o modelo de Posson e o modelo de quase-verossmlhança cuja função de varânca é proporconal à méda da varável resposta. O conceto de quase-verossmlhança estendda fo muto relevante para a análse realzada neste artgo. Esse conceto permte defnr o quase-desvo estenddo, que fo utlzado para decdr dentre o Modelo 2 e o Modelo 3 aquele que é mas adequado ao conjunto de dados das IFES. A prncpal propredade do quase-desvo estenddo é que este pode ser usado para comparar modelos com funções de varânca dferentes, o que não ocorre com o quase-desvo nem com o desvo. O modelo pode ser faclmente ncorporado à rotna de gerencamento das IFES. Uma vez estabelecdo o orçamento global das IFES, o percentual relatvo a cada nsttução pode ser estmado a partr do Modelo 2 e, posterormente, com base neste percentual, o valor referente a cada IFES pode ser calculado. Agradecmentos. Os autores agradecem a um revsor anônmo pelos seus comentáros, que foram utés na melhora da prmera versão deste artgo em relação à exposção das déas dscutdas. Os autores também agradecem ao suporte fnancero do CNPq. AMARAL, G.J.A., CORDEIRO, G.M. A budget alocaton model for the Brazlan Federal Unverstes: An applcaton of the generalzed lnear models. Rev. Mat. Estat., São Paulo, v.21, n.2, p.55-69, 2003. ABSTRACT: In ths paper we develop a generalzed lnear model to explan the budget receved by federal unverstes from the Brazlan government. In ths model, the Box and Cox (1964) transformaton s used to fnd the best varance functon and the concept of quas-lkelhood s 68 Rev. Mat. Estat., São Paulo, v.21, n.2, p.57-71, 2003

ntroduced n order to estmate the parameters of the model. In addton, the extended quas-devance s used to compare that model wth another quas-lkelhood model. KEYWORDS: Econometrcs models; extended quas-devance; quas-lkelhood functons. Referêncas AMARAL, G. J. A. Modelo de alocação de recursos entre as nsttuções federas de ensno superor: uma aplcação dos modelos lneares generalzados, 1997. 122f. Dssertação (Mestrado em Estatístca) Departamento de Estatístca, Unversdade Federal de Pernambuco. Recfe, 1997. BAKER, R. J. GLIM: Reference gude, numercal algorthms group. Oxford: Oxford, 1985. BOX, G. E. P.; COX, D. R. An analyss of transformatons. J. R. Statst. Soc. B, v.26, p.211-43, 1964. FISHER, R. A. A bologcal assay of tuberculns. Bometrcs, v.5, p.300-16, 1949. FRANCIS, B.; GREEN, M.; PAYNE, C. The GLIM system generalzed lnear nteractve modellng. New York: Prentce Hall, 1993. McCULLAGH, P.; NELDER, J. R. Generalzed lnear models. 2. ed. London: Chapman and Hall, 1989. 532p NELDER, J. A.; PREGIBON, D. An extended quas-lkelhood functon. Bometrka, v.74, p.221-32, 1987. NELDER, J. A.; WEDDERBURN, R. W. M. Generalzed lnear models. J. R. Statst. Soc. A, v.135, p.370-84, 1972. WEDDERBURN, R. W. M. Quas-lkelhood functons, Generalzed lnear models and the Gauss Newton method. Bometrka, v.61, p.439-47, 1974. Recebdo em 22.06.2001. Aprovado após revsão em 17.03.2003. Rev. Mat. Estat., São Paulo, v.21, n.2, p.55-69, 2003 69