OTIMIZAÇÃO DE MODELOS DE REGRESSÃO MULTIVARIADOS VISANDO ESTIMAR O VALOR DE HIDROXILAS EM POLIÓIS DE ORIGEM PETROQUÍMICA E VEGETAL Daniela Fachini (UFRGS) danifachini@ig.com.br Rafael Bitello Silva (UFRGS) rafaelbitello@yahoo.com.br Luciano Marder (UNISC) lucmarder@yahoo.com.br Marco Flôres Ferrão (UNISC) ferrao@unisc.br Annelise Engel Gerbase (UFRGS) agerbase@ufrgs.br Este trabalho desenvolveu modelos de regressão multivariados visando estimar o valor de hidroxilas (OHV) em polióis tanto de origem petroquímica como vegetal (óleo de soja e de mamona). São comparados os desempenhos de modelos de regressão por mínimos quadrados parciais (PLS), por mínimos quadrados parciais por intervalo (ipls) e por mínimos quadrados parciais por sinergismo de intervalos (sipls), empregando dados obtidos pela espectroscopia por reflexão total atenuada no infravermelho (FT-IR/ATR). Os resultados obtidos para o algoritmo ipls mostraram que a seleção de parte do espectro é imprescindível para a obtenção de modelos de regressão multivariados visando a previsão do número de hidroxilas em polióis de origem petroquímica e vegetal a partir dos sinais dos espectros de reflexão total atenuada (FTIR-ATR). Não foi verificada melhora na capacidade preditiva dos modelos de calibração multivariada empregando-se a seleção de regiões do espectro através do algoritmo sipls. Todos os modelos que apresentaram bom desempenho na determinação do valor de hidroxilas selecionaram as regiões do espectro relacionadas quimicamente ao parâmetro em questão. Os resultados obtidos demonstram as potencialidades de desenvolvimento de metodologias analíticas mais limpas e rápidas para a análise de polióis de origem petroquímica e vegetal a partir do infravermelho, facilitando assim a especificação destes produtos na indústria. Palavras-chaves: Polióis, valor de hidroxilas, regressão por mínimos quadrados parciais, espectroscopia no infravermelho.
1. Introdução Nos últimos anos, o uso de fontes renováveis tem atraído muita atenção devido ao seu grande potencial em substituir derivados petroquímicos. Neste sentido, óleos vegetais, como o óleo de soja, tem encontrado uma grande aplicabilidade como excelente base para materiais poliméricos (MONTEAVARO et al., 2005). Os polióis oleoquímicos vem sendo usados, principalmente na produção de espumas, revestimentos, adesivos e poliuretanas termoplásticas (GUO, JAVNI & PETROVIC, 2000; PETROVIC, GUO & ZHANG, 2000; HU et al., 2002; GUO et al., 2002). Para a preparação destas poliuretanas é importante saber o valor de hidroxilas (OHV) do poliol empregado. Normalmente o OHV é determinado pelo método padrão da AOCS Cd 13-60 e o valor de hidroxilas é expresso em mg de KOH por g de óleo (American Oil Chemists Society, 1997). Embora este método seja confiável e reprodutível, se realizado sob condições padronizadas, apresenta alguns incovenientes como o uso de quantidades significativas de amostras e de reagentes químicos, entre os quais se destacam a piridina e o anidrido acético, que requerem um cuidado no seu manuseio por serem nocivos à saúde e os resíduos gerados da análise química devem ser tratados antes do seu descarte no meio ambiente. Recentemente, novas tecnologias de análise, como a espectroscopia no infravermelho com transformada de Fourier (FT-IR) associada aos métodos de regressão multivariados, têm sido propostas como alternativa atrativa aos métodos padrão de análise por ser uma técnica não destrutiva, de baixo custo, com um menor tempo de análise, além de utilizar pequenas quantidades de amostra e não gerar resíduos químicos (PARREIRA et al., 2002; AL-ALAWI & VAN DE VOORT, 2004). Além disso, as metodologias empregando FT-IR com reflexão total atenuada horizontal (ATR) simplificam muito os problemas de manejo das amostras, tornando mais acessíveis as rotinas de controle de qualidade industrial (BORIN & POPPI, 2004). Entre os métodos multivariados, a regressão por mínimos quadrados parciais (PLS) é o mais comum para construção de modelos usando sinais de espectros (GELADI & KOWALSKI, 1986). Em 1998, Spiegelman et al., demonstraram que a seleção da região espectral a ser modelada pode melhorar o desempenho dessa técnica de calibração em relação aos modelos que empregam o espectro inteiro. Regiões específicas (ou sinais infravermelhos) são selecionadas onde a colinearidade não está tão presente, gerando modelos mais robustos. Na prática, a otimização dos modelos de regressão multivariados, está baseada na identificação de subconjuntos dos dados completos (sub-regiões espectrais), que combinados ou não, minimizam os erros de predição. Visando desenvolver e otimizar uma metodologia analítica rápida e não destrutiva, capaz de estimar o OHV em polióis tanto de origem petroquímica como vegetal (óleo de soja e mamona) usando FT-IR/ATR, neste trabalho foram empregados e comparados os algoritmos de regressão multivariada por mínimos quadrados parciais (PLS), por mínimos quadrados parciais por intervalo (ipls) e por mínimos quadrados parciais por sinergismo (sipls). 2. Espectroscopia por Reflexão Total Atenuada A espectroscopia no infravermelho com transformada de Fourier (FT-IR) permite obter informações qualitativas e quantitativas rapidamente e, quando associada a reflectância total atenuada (ATR), simplifica a realização das análises (BORIN & POPPI, 2005). Na ATR a 2
amostra é colocada em contato com um elemento de reflexão interna (IRE) construído de um material com alto índice de refração, como por exemplo seleneto de zinco (ZnSe). Na Figura 1 é apresentado um esquema de como o processo de reflexão interna ocorre (MIRABELLA, 1985). n 2 Elemento De ATR θ E y0 E x0 Amostra n 3 E z0 Decaimento do Campo Evanescente z E/E 0 Figura 1 Representação da propagação da radiação infravermelha através do IRE (FERRÃO, 2000). 3. Mínimos quadrados parcias (PLS) No PLS a calibração multivariada é realizada utilizando a informação do espectro inteiro para construir um modelo da regressão, relacionado à propriedade de interesse. Por esta razão é chamado de método full-spectrum (BORIN & POPPI, 2005). Neste trabalho o PLS foi utilizado com o MATLAB, o qual integra computação matemática, visualização e linguagem eficiente em ambiente flexível para computação técnica. 3.1 Mínimos quadrados parcias por intervalo (ipls) Existem várias maneiras de selecionar a região espectral utilizando critérios objetivos, como por exemplo, avaliar a correlação da região selecionada com a o método de referência (R 2 ), ou avaliar a raiz quadrada dos erros médios de calibração cruzada (RMSECV), e ainda utilização de algoritmos que indicam o conjunto de variáveis espectrais que poderá dar melhores resultados com base no R 2 e/ou no RMSEP. Dentre os mais empregados encontram-se os métodos heurísticos como o algoritmo genético e a busca tabu, ou determinísticos como por exemplo o método de mínimos quadrados parciais por intervalo (Interval Partial Least- Squares ipls) (ZOU et al., 2007; ZOU, LI & ZHAO, 2007). O método ipls é uma extensão do PLS (NORGAARD et al., 2000), no qual divide-se o conjunto de dados (espectros) em um determinado número de intervalos, constrói-se o modelo PLS para cada intervalo, apresentando os resultados em um gráfico para facilitar a comparação. O método é planejado para dar uma visão geral dos dados e pode ser útil na interpretação de quais sinais do espectro são mais representativos na construção de um bom modelo de calibração. 3.2. Regressão por mínimos quadrados parciais por sinergismo de intervalos (sipls) Para relacionar os subintervalos, a fim de obter melhores habilidades preditivas, pode ser utilizado também, o algoritmo dos mínimos quadrados parciais por sinergismo de intervalos (sipls), (MUNK et al., 2001) uma extensão do ipls. Este possibilita selecionar a melhor 3
combinação de intervalos, combinando 2 a 2, 3 a 3 e até 4 a 4 sub-regiões do espectro, fornecendo geralmente melhores coeficientes de determinação e os menores erros de predição do que o ipls. 4. Material e métodos 4.1. Obtenção dos poliós de origem petroquímica e vegetal (óleo de soja e mamona) Para o desenvolvimento deste estudo foram empregadas 14 amostras de polióis de origem petroquímica e 19 de origem vegetal (óleo de soja e mamona). Os polióis petroquímicos foram doados pela Basf Poliuretanos Ltda (Mauá, SP, Brasil), sendo estes com diferentes OHV (na faixa de 28,0 a 584,5 mg KOH por grama de amostra). Os polióis vegetais (de óleo de soja e de óleo de mamona) foram doados pelo Instituto de Química da Universidade Federal do Rio Grande do Sul (UFRGS), sendo estes com diferentes OHV (na faixa de 22,2 508,0 mg KOH por grama de amostra). O OHV dos polióis de soja e mamona foram determinados pelo método padrão Cd 13 60 (AOCS, 1997). 4.2. Obtenção dos espectros no infravermelho Para obtenção dos espectros no infravermelho foi empregado um acessório de reflexão total atenuada horizontal com cristal de ZnSe da PIKE Technologies acoplado a um espectrofotômetro de infravermelho com transformada de Fourier NICOLET Magna 550. Os espectros foram obtidos na faixa de 4000 a 650 cm -1, com resolução de 4 cm -1 e 32 varreduras. Foi adquirido um espectro para cada amostra de poliol. 4.3. Construção do modelos multivariados O itoolbox para MATLAB (NORGAARD et al., 2000) foi usado para desenvolver os modelos multivariados de PLS, ipls e sipls. O programa foi rodado num IBM - compatível Intel Pentium 4 CPU 3.00 GHz e 1 Gb RAM microcomputador. Para calcular o erro dos modelos de calibração foi empregado o RMSE (Root Mean Square Error), conforme equação a seguir: RMSE = n i= 1 ( y yˆ ) 2 n onde n é o número de espectros, y i e ŷ i são os valores determinados pelo método padrão da AOCS e predito pelos modelos de calibração (PLS, ipls ou sipls), respectivamente, utilizando as amostras do conjuntos de calibração (RMSEC), de validação cruzada (RMSECV) ou de previsão (RMSEP). Calibração e validação cruzada: 24 espectros obtidos por FT-IR/ATR foram empregados para a construção dos modelos de calibração. As amostras com valores extremos de OHV foram incluídas no conjunto de calibração. Foram empregadas amostras tanto de poliol petroquímico como vegetal. Para a validação cruzada foi retirada uma amostra por vez e com as restantes é construído um modelo de calibração e prevista a amostra retirada. Este procedimento foi repetido até todas as 24 amostras terem sido previstas determinando-se assim o RMSECV que foi empregado para definir o número de variáveis latentes em todos os modelos. Previsão: 9 espectros obtidos por FT-IR/ATR foram empregados para avaliar o desempenho dos modelos de calibração, com os quais obteve-se o RMSEP. Foram empregadas amostras i i 4
tanto de poliol petroquímico como vegetal. 5. Resultados e discussões 5.1. Modelos ipls Com base no conjunto de dados foi desenvolvido inicialmente um modelo de regressão, empregando o método PLS, para a determinação do número de hidroxilas utilizando toda região espectral (650 cm -1 a 4000 cm -1 ), sendo os valores de RMSECV, RMSEP e RMSEC, bem como o número de variáveis latentes empregado (VLs), apresentado na Tabela 1. Estes resultados revelam que o modelo global tende a superestimar, uma vez que o valor do erro de previsão (RMSEP) é muito superior ao erro de calibração (RMSEC). Buscando otimizar a construção dos modelos de regressão multivariados empregando a regressão por mínimos quadrados parciais, a fim de obter modelos mais robustos, foram desenvolvidos novos modelos empregando o algoritmo ipls, dividindo a região espectral em 2, 3, 4, 5, 10, 15, 20 e 25 intervalos. Este procedimento faz com que partes do espectro sejam modeladas e assim pode-se selecionar a melhor região do espectro cujos sinais do espectro estejam relacionados de forma mais efetiva com o valor de hidroxilas presentes nos polióis de origem petroquímica e vegetal. Neste procedimento também se eliminam aquelas regiões do espectro que apresentam pouca informação sobre a propriedade em questão, diminuindo assim a maior parte da vulnerabilidade dos modelos de calibração que utilizam sinais espectroscópicos. Na Tabela 1 são apresentados os valores de RMSECV, RMSEP e RMSEC, o número de variáveis latentes empregado para cada um dos modelos ipls, bem como o intervalo (região do espectro) selecionado e que apresenta o menor erro de calibração cruzada (RMSECV) quando comparado com os demais. Todos os modelos ipls avaliados apresentam menores valores de erro que o modelo global, isto é, do que o modelo que utiliza todo o sinal dos espectros. Dentre estes pode-se destacar o ipls4, ipls5, ipls10 e ipls25 que apresentaram valores de RMSEP (erro de previsão) menores e na mesma ordem de grandeza que os valores de RMSEC (erro de calibração), sendo estes mais adequados para a previsão do número de hidroxilas para amostras de natureza semelhante aquelas empregadas neste trabalho. Modelo Intervalos Vls RMSECV a RMSEP a RMSEC a global TODOS 7 60,06 83,39 20,57 ipls2 2 5 45,11 29,80 32,36 ipls3 3 6 40,78 72,44 21,52 ipls4 4 6 35,23 21,69 23,13 ipls5 5 5 33,84 21,66 24,44 ipls10 9 6 33,20 26,10 23,46 ipls15 13 4 43,42 34,49 33,18 ipls20 17 3 42,34 32,85 34,66 ipls25 22 5 31,61 23,61 23,63 a Valores expressos em mg de KOH/g 5
Tabela 1 Resultados obtidos para os modelos ipls Na figura 2 são apresentados alguns dos gráficos comparativos para os modelos ipls, nos quais a linha tracejada representa o valor de RMSECV para o modelo global, empregando-se 7 variáveis latentes. As barras delimitam a subregião do sinal utilizado para cada intervalo e sua altura, o valor de RMSECV para o respectivo intervalo, considerando o número de variáveis latentes que encontra-se identificado na base de cada barra. Por exemplo, para o primeiro gráfico, que se refere ao ipls5 (o espectro dividido em 5 intervalos equidistantes), a primeira subregião (intervalo 1) apresenta elevado RMSECV, sendo este maior que o RMSECV do modelo global (linha tracejada), não sendo um bom modelo. Por outro lado, a última região (intervalo 5) apresenta o menor RMSECV, quando comparada as outras 4 subregiões (intervalos 1,2,3 e 4), e além disso, menor RMSECV que o modelo global (linha tracejada), sendo esta a melhor região do espectro quando o mesmo é subdividido em 5 intervalos. Comparando todos os 4 gráficos da Figura 2, onde varia-se o número de intervalos nos quais o sinal foi subdividido, podemos observar que sempre o melhor modelo de cada ipls utilizou parte do último sinal do espectro (uma banda larga), que está associada ao estiramento da ligação O-H presente nos polióis estudados (BARBOSA, 2007). Figura 2 Representação gráfica dos resultados para os modelos ipls de 4, 5, 10, 15, 20 e 25 intervalos 6
5.2. Modelos sipls De forma análoga aos modelos ipls que selecionam apenas 1 intervalo, foram desenvolvidos outros modelos de regressão empregando o algoritmo sipls, dividindo a região espectral em 5, 10, 15, 20 e 25 intervalos, seguido pela combinação de 2 ou 3 intervalos para o sipls de 5 intervalos e de 2, 3 e 4 intervalos para os demais. Todas as combinações possíveis não foram realizadas pois neste procedimento ocorre o que chamamos explosão combinatorial, cujo custo computacional não justifica o emprego do sipls para otimização de modelos de regressão multivariada, sendo neste caso mais adequado o uso de metaheurísticas, como algoritmo genético, para explorar de forma mais rápida as melhores soluções (combinações de intervalos) (KONZEN et al., 2003; LEARDI & NORGAARD, 2004). No sipls buscamos combinar os intervalos (subregiões do espectro), buscando verificar se a combinação de algumas destas resultam em sinergirmo, isto é, modelos com menor erro que os modelos obtidos com apenas um dos intervalos. Este procedimento é útil no caso dos sinais do espectro que sejam importante na construção dos modelos de regressão estarem em partes distintas do espectro. Os valores de RMSECV, RMSEP e RMSEC para todos os teste realizados, bem como para o modelo global, são apresentados na Tabela 2. Com base nestes resultados podemos destacar os modelos s2ipls15, s2ipls20 e s2ipls25 que apresentaram os menores erros de previsão (RMSEP), dentre os modelos sipls desenvolvidos. Observa-se que, apesar de alguns modelos sipls apresentarem RMSECV e RMSEC menores que os modelos ipls, nenhum destes apresentou menores erros de previsão (RMSEP) que os modelos ipls destacados inicialmente. Inclusive o s2ipls20 é o mesmo modelo que o ipls10, pois no s2ipls20 são selecionados os intervalos 17 e 18, que juntos equivalem ao intervalo 9 do modelo ipls10. Modelo Intervalos Vls RMSECV a RMSEP a RMSEC a FULL TODOS 7 60,06 83,39 20,57 s2ipls5 4 e 5 5 44,95 29,74 32,37 s3ipls5 2, 4 e 5 7 42,41 63,47 20,51 s2ipls10 3 e 9 7 31,48 86,14 16,15 s3ipls10 3, 9 e 10 7 31,44 85,94 16,13 s4ipls10 3, 8, 9 e 10 8 31,47 62,45 12,69 s2ipls15 12 e 13 7 33,06 25,24 21,23 s3ipls15 4, 13 e 14 6 32,24 61,14 21,49 s4ipls15 4, 12, 13 e 14 7 31,48 48,90 17,93 s2ipls20 17 e 18 6 33,20 26,10 23,46 s3ipls20 5, 17 e 18 6 32,71 41,67 21,02 s4ipls20 5, 6, 17 e 18 7 31,47 86,11 16,15 s2ipls25 20 e 22 6 32,91 25,37 22,83 7
5.3. Considerações finais s3ipls25 22, 24 e 25 6 27,18 29,49 8,84 s4ipls25 15, 16, 17 e 18 9 26,98 116,61 10,88 a Valores expressos em mg de KOH/g Tabela 2 Resultados obtidos para os modelos sipls Conforme apresentado, ambos os algoritmos de otimização conduzem na construção de modelos de calibração multivariada capazes de prever o valor de OH dos polióis petroquímicos e vegetais empregados. Porém, se aparentemente apenas uma parte do sinal dos espectros, que se refere ao estiramento O-H, é suficiente para modelar, o número de variáveis latentes igual a 5 ou superior poderia estar superestimando os resultados dos modelos. Podese justificar um número aparentemente alto de variáveis latentes para a determinação em questão, se compararmos o perfil e o valor do máximo de alguns dos espectros obtidos dos diferentes polióis analisados, conforme Figura 3. Pela análise da figura fica claro que não existe um único tipo de sinal para as hidroxilas, isto é, para os polióis estudados temos sinais diferentes no espectro que precisam ser modelados simultaneamente para obter um modelo representativo, e consequentemente um maior número de variáveis latentes se faz necessário. 1.0 0.9 3359 0.8 3371 3413 0.7 3382 3452 Log(1/R) 0.6 0.5 3390 3425 3479 3504 0.4 0.3 0.2 0.1 0.0 3200 3400 3600 Wavenumbers (cm-1) 6. Conclusões Figura 3 Região do estiramento da ligação O-H de alguns dos polióis analisados Os resultados obtidos para o algoritmo ipls mostraram que a seleção de parte do espectro, para a construção de modelos de regressão por mínimo quadrados parciais, permite a obtenção de modelos de regressão multivariados para a previsão do número de hidroxilas em polióis de origem petroquímica e vegetal utilizando-se os sinais dos espectros de reflexão total atenuada (FTIR-ATR). De uma forma geral para os melhores modelos obtidos os intervalos (regiões do espectro) selecionadas pelo algoritmo sipls foram equivalentes aquelas selecionadas pelo ipls, podendo-se neste caso optar por qualquer umas das estratégias de otimização. 8
Finalmente pode-se dizer que a seleção do sinal do espectro mais relacionada com a quantificação do número de hidroxilas é fundamental no desenvolvimento de metodologias analíticas mais limpas e rápidas para a análise de polióis de origem petroquímica e vegetal, facilitando assim a especificação destes produtos na indústria. Agradecimentos Este trabalho teve o apoio financeiro da CAPES, CNPq e da FAPERGS. Os autores ainda agradecem a Basf Poliuretanos Ltda (Mauá, SP, Brasil) e Vinícius Bassanesi Veronese do Instituto de Química da Universidade Federal do Rio Grande do Sul (UFRGS) pela doação das amostras empregadas neste estudo. Referências AL-ALAWI, A. & VAN DE VOORT, F.R. New method for the quantitative determination of free fatty acids in oil by FTIR spectroscopy. Journal of the American Oil Chemists' Society. Vol. 81, p. 441-446, 2004. AMERICAN OIL CHEMISTS SOCIETY. Official Methods and Recommended Practices of de American Oil Chemists Society, 4th edn, Champaing, 1993, revised 1997. BARBOSA, L.C.A. Espectroscopia no infravermelho na caracterização de compostos orgânicos. Viçosa: Editora Universidade Federal de Viçosa, 2007. BORIN, A. & POPPI, R.J. Multivariate Quality Control of Lubricating Oils Using Fourier Transform Infrared Spectroscopy. Journal of the Brazilian Chemical Society. Vol. 15, n.4, p. 570-576, 2004. BORIN, A. & POPPI, R.J. Application of mid infrared spectroscopy and ipls for the quantification of contaminants in lubricating oil. Vibrational Spectroscopy. Vol. 37, p. 27-32, 2005. FERRÃO, M.F. Aplicação de técnicas espectroscópicas de reflexão no infravermelho no controle de qualidade de farinha de trigo. Ph.D Thesis, Instituto de Química, Universidade Estadual de Campinas, Campinas, 2000. GELADI, P. & KOWALSKI, B.R. Partial Least-Squares Regression: A Tutorial. Analytica Chimica Acta. Vol. 185, p. 1-17, 1986. GUO, A.; DEMYDOV, D.; ZHANG, W. & PETROVIC, Z.S. Polyols and Polyurethanes from Hydroformylation of Soybean Oil. Journal of Polymers and the Environment. Vol. 10, p.49-52, 2002. GUO, A.; JAVNI, I. & PETROVIC, Z.S. Rigid polyurethane foams based on soybean oil. Journal of Applied Polymer Science. Vol. 77, n.2, p. 467-473, 2000. HU, Y.H.; GAO, Y.; WANG, D.N.; HU, C.P.; ZU, S.; VANOVERLOOP, L. & RANDALL, D. Rigid polyurethane foam prepared from a rape seed oil based polyol. Journal of Applied Polymer Science. Vol.84, n.3, p. 591-597, 2002. KONZEN, P.H.A.; FURTADO, J.C.; CARVALHO, C.W.; FERRÃO, M.F.; MOLZ, R.F; BASSANI, I.A. & HÜNING, S.L. Otimização de métodos de controle de qualidade de fármacos usando algoritmo genético e busca tabu. Pesquisa Operacional. Vol. 23, n. 1, p. 189-207, 2003. LEARDI, R. & NORGAARD, L. Sequential application of backward interval partial least squares and genetic algorithms for the selection of relevant spectral regions. Journal of Chemometrics. Vol. 18, n. 11, p. 486-497, 2004. MIRABELLA, F.M.Jr. Internal reflection spectroscopy. Applied Spectroscopy Reviews Vol. 21, p. 45-178, 1985. MONTEAVARO, L. L.; RIEGEL, I. C.; PETZHOLD, C. L. & SAMIOS, D. Thermal Stability of Soy-based Polyurethanes. Polímeros: Ciência e Tecnologia. Vol. 15, n. 2, p. 151-155, 2005. MUNCK, L.; NIELSEN, J.P.; MOLLER, B.; JACOBSEN, S.; SONDERGAARD, I.; ENGELSEN, S.B.; NORGAARD, L.; BRO, R. Exploring the phenotipyc expression of a regulatory proteome-altering gene by spectroscopy and chemometrics. Analytica Chimica Acta. Vol. 446, p. 171-186, 2001. NORGAARD, L.; SAUDLAND, A.; WAGNER, J.; NIELSEN, J.P. & MUNCK, L. Interval Partial Least- 9
Square Regression (ipls): A comparative Chemometric Study with an Example from near-infrared spectroscopy. Applied Spectroscopy. Vol. 54, n. 3, p. 413-419, 2000. PARREIRA, T.F.; FERREIRA, M.M.C; SALES H.J.S & ALMEIDA, W.B. Quantitative Determination of Epoxidized Soybean Oil Using Near Infrared Spectroscopy. Applied Spectroscopy, Vol. 54, p. 1607-1614, 2002. PETROVIC, Z.S.; GUO, A. & ZHANG, W. Structure and properties of polyurethanes based on halogenated and nonhalogenated soy-polyols. Journal of Polymer Science Part A: Polymer Chemistry. Vol. 38, n.22, p. 4062-4069, 2000. SPIEGELMAN, C. H.; MCSHANE, M. J.; COTÉ, G. L.; GOETZ, M. J.; MOTAMEDI, M. & YUE, Q. L. Theoretical justification of wavelength selection in PLS calibration: development of a new algorithm. Analytical Chemistry. Vol. 70, p. 35-44, 1998. ZOU, X.; ZHAO, J.; HUANG, X. & LI, Y. Use of FT-NIR spectrometry in non-invasive measurements of soluble solid contents (SSC) of Fuji apple based on different PLS models. Chemometrics and Intelligent Laboratory Systems. Vol. 87, n.1, p. 43-51, 2007. ZOU, X.; LI, Y. & ZHAO, J. Using genetic algorithm interval partial least squares selection of the optimal near infrared wavelength regions for determination of the soluble solids content of Fuji apple. Journal of Near Infrared Spectroscopy. Vol. 15, n.3, p. 153-159, 2007. 10