Ajuste do modelo logístico ao número de alunos ingressos nos cursos superiores do IFSEMG - Câmpus Rio Pomba Diánis Ferreira Irias 1 2 Marcos Coutinho Mota 1 2 Flávio Bittencourt 1 2 1 Introdução Os institutos federais têm buscado espaço nos debates sobre educação em todo o território nacional. Em Rio Pomba - MG está localizado um dos câmpus do Instituto Federal de Educação, Ciência e Tecnologia do Sudeste de Minas Gerais (IFSEMG), que completou 50 anos em 2012 como instituição de ensino. Antes de se tornar câmpus foi fazenda experimental, colégio agrícola, escola agrotécnica, CEFET-Rio Pomba. Os cursos superiores tiveram início no ano de 2003 com 32 alunos no curso de Tecnologia em Laticínios. Hoje neste câmpus há sete cursos de graduação em diversas áreas: Administração, Agroecologia, Ciência da Computação, Ciência e Tecnologia de Alimentos, Licenciatura em Matemática, Tecnologia em Laticínios e Zootecnia, além dos cursos técnicos profissionalizantes. O objetivo deste trabalho foi ajustar um modelo não-linear logístico aos dados de ingressos nos cursos superiores no período de 2003 a 2012 e verificar a qualidade de ajuste do modelo por meio da análise gráfica dos resíduos e pela aplicação dos testes Shapiro-Wilk, Breusch- Pagan e Durbin-Watson, para verificar, respectivamente, as pressuposições de normalidade, homogeneidade de variância e independência dos resíduos. 2 Material e Métodos Os dados do número de ingressos nos cursos superiores do período 2003 a 2012 foram obtidos na Secretaria de Graduação e Pós-Graduação do Câmpus Rio Pomba. Posteriormente, confeccionou-se o diagrama de dispersão para verificar o comportamento dos dados. Como o diagrama de dispersão obtido apresentou um comportamento de uma curva sigmoidal, isto é, uma curva em forma de S, um modelo logístico para representar o crescimento populacional foi adotado, Equação 1 (ANTON, BIVENS & DAVIS, 2007). y i = 1 DMAFE - IFSEMG/Rio Pomba. e-mail: dianis.irias@hotmail.com 2 Agradecimento ao PIBID/CAPES, PRODOCÊNCIA/CAPES, IFSEMG L 1 + Aexp( kx i ) + ε i (1) 1
Neste modelo os parâmetros a serem estimados são L, A e k. O parâmetro L representa a assíntota e k representa a taxa de crescimento ou descrecimento. Os erros são considerados normais independentes e homocedásticos. Por meio do programa R (R DEVELOPMENT CORE TEAM, 2012) e por meio das técnicas apresentadas por Regazzi (2003) para a obtenção dos valores iniciais para o programa SAS das estimativas dos parâmetros que serão adotadas no processo iterativo ajustou-se o modelo logístico acima. Para a verificação do pressuposto de normalidade, foi utilizado o teste Shapiro-Wilk (SHA- PIRO; WILK, 1965) e o Q-Q plot que é um gráfico que testa a conformidade entre a distribuição empírica e uma dada distribuição teórica. O teste de Breusch-Pagan (BREUSCH; PAGAN, 1979) foi utilizado para verificar a pressuposição de homogeneidade de variâncias e um gráfico dos resíduos contra os valores estimados foi utilizado para examinar se as variâncias dos erros eram constantes, observando se a dispersão dos resíduos ocorre aleatoriamente em torno da média zero. Para testar a existência de autocorrelação de primeira ordem foi utilizado o teste Durbin- Watson (DURBIN; WATSON, 1950) e o gráfico de resíduos. Para obtenção dos gráficos de resíduos, utilizou-se o pacote nlme (Pinheiro et al., 2012) do programa R (R DEVELOPMENT CORE TEAM, 2012) e os procedimentos para obtenção dos gráficos e aplicação dos testes foram os detalhados por Souza (2012). 3 Resultados e discussões As estimativas dos parâmetros do modelo e o respectivo modelo ajustado são apresentados na Equação 2: ŷ i = 268, 063 1 + 1854,754exp( 1,612x i ) (2) A representação gráfica do modelo ajustado e dos dados observados são apresentados na Figura 1. O número de ingressos por ano são representados por pontos e o modelo ajustado pela linha tracejada. Pode-se observar que o modelo proposto subestima o número de ingressos nos cursos superiores nos três primeiros anos e superestima nos três últimos anos. Observa-se, também, um crescimento abrupto de ingressos entre os anos 2006 a 2008, anos que coincidem com a criação do Instituto Federal, Ciência e Tecnologia Sudeste de Minas Gerais e ampliação do número de cursos superiores. O valor da abscissa do ponto de inflexão da Equação 1, calculado por meio da segunda derivada, mostra o momento em que a taxa de crescimento muda de comportamento, de crescente 2
Figura 1: Modelo ajustado ao número de ingressos nos cursos superiores IFSEMG-Rio Pomba passa a decrescente, Equação 3. y = LAk2 exp( kx) + LA 2 k 2 exp( 2kx) (1 + Aexp( kx)) 3 (3) Igualando a Equação 3 a zero, obtém-se x = lna, e fazendo as devidas substituições obtémse para a abscissa o valor 4,66, valor este situado entre os anos 2006 e k 2007. A taxa de crescimento máxima é obtida por meio da primeira derivada da Equação 1, o valor é encontrado substituindo o valor da abscissa do ponto de inflexão. A primeira derivada é apresentada na Equação 4. y = LAk exp( kx) (1 + Aexp( kx)) 2 (4) Portanto, substituindo o valor de x do ponto de inflexão, obtém-se a Equação 5, y = LAk exp( lna) (1 + Aexp( lna)) 2 (5) E, fazendo-se os devidos cálculos, encontra-se ao valor 108,03, correspondendo à variação máxima de ingressos nos cursos superiores. A análise gráfica dos resíduos apresentada na Figura 2 permite visualizar o comportamento dos resíduos. E os resultados dos testes aplicados apresentados na Tabela 1 permitem verificar se as pressuposições do modelo ajustado foram atendidas. Pelo quadro resíduos ou resíduos estudentizados versus os valores ajustados, verifica-se que 3
Figura 2: Análise gráfica dos resíduos do modelo logístico ajustado ao número de ingressos nos cursos superiores do IFSEMG-Rio Pomba Tabela 1: Resultados dos testes para verificar as pressuposições do modelo ajustado Testes e valor-p Shapiro-Wilk Breuch-Pagan Durbin-Watson 0,0946 0,2993 0,1041 os resíduos apresentam uma distribuição aleatória em torno da média 0, o que indica a homogeneidade de variância, confirmado pelo resultado do teste, valor-p igual 0,2993, de Breusch- Pagan apresentado na Tabela 1. No gráfico Q-Q plot observa-se que os resíduos se distribuem em torno da reta de 45 o, indicando que os dados são normalmente distribuídos, o que também foi confirmado pela conclusão do teste Shapiro-Wilk apresentada na Tabela 1. No gráfico de autocorrelção os resíduos encontram-se dispersos em torno da linha horizontal 0, indicando que os resíduos são independentes e o resultado do teste de Durbin-Watson, apresentado na Tabela 1 corrobora essa indicação. 4 Conclusões Após a análise gráfica e aplicação dos testes estatísticos, verificou-se que as pressuposições de normalidade, independência e homogeneidade de variância dos resíduos foram atendidas e concluiu-se que o modelo logístico ajustado é adequado para representar o número de alunos ingressos nos cursos superiores do IFSEMG-Rio Pomba. Os resultados obtidos por meio da primeira e segunda derivadas permitem concluir que 4
o período com maior número de ingressos nos cursos superiores coincide com a criação do IFSEMG e com a abertura de mais cursos superiores no Câmpus Rio Pomba, apresentando uma taxa de crescimento máxima igual a 108,03 alunos neste período. Referências [1] ANTON, H.; BIVENS, I.; DAVIS, S. Cálculo. v.2, 8.ed. Porto Alegre: Bookman, 2007. [2] BREUSCH, T ; PAGAN, A. Teste simples para heterocedasticidade e coeficiente de variação aleatória econométrica. Sociedade Econométrica, v.47, p.1287-1294. 1979. [3] DURBIN, J.; WATSON, G. S. Teste de Correlação Serial em Mínimos Quadrados de Regressão I. Biometrika, Cambridge, v.37, p.409-428, 1950. [4] PINHEIRO, J.; BATES, D.; DEBROY, S.; SARKAR, D.; R DEVELOPMENT CORE TEAM (2012). nlme: Linear and Nonlinear Mixed Effects Models. R package version 3.1-103, 2012. [5] R DEVELOPMENT CORE TEAM (2012). R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. ISBN 3-900051-07-0, URL http://www.r-project.org/. [6] SHAPIRO,S. S.; WILK, M. B. An Analysis of variance test for normality. Biometrika, Cambridge, v. 52, n. 3/4, p.591-611, dec. 1965. [7] SOUSA, I. F. Ajuste de modelos não lineares na descrição de germinação de sementes de café (Coffea arabica L.) CV. Catuaí. 72p. Dissertação (Mestrado em Estatística e Experimentação Agropecuária) - Universidade Federal de Lavras, Lavras, MG, 2012. 5