OTIMIZAÇÃO DE MODELOS DE REGRESSÃO MULTIVARIADOS VISANDO ESTIMAR O VALOR DE HIDROXILAS EM POLIÓIS DE ORIGEM PETROQUÍMICA E VEGETAL



Documentos relacionados
TRANSFORMADAS DISCRETAS WAVELETS APLICADAS NA COMPACTAÇÃO DE SINAIS FT-IR/ATR PARA A CONSTRUÇÃO DE MODELOS DE REGRESSÃO

MODELOS DE REGRESSÃO MULTIVARIADA EMPREGANDO SELEÇÃO DE INTERVALOS PARA A QUANTIFICAÇÃO DO BIODIESEL EM BLENDAS BIODIESEL/DIESEL

OTIMIZAÇÃO POR ENXAME DE PARTÍCULAS DE MODELOS DE REGRESSÃO VISANDO A IDENTIFICAÇÃO DE ADULTERAÇÕES NAS BLENDAS BIODIESEL/DIESEL

RECOMENDAÇÕES SOBRE A UTILIZAÇÃO DA TÉCNICA DE DERIVAÇÃO PARA AUMENTO DE RESOLUÇÃO EM ESPECTROS DE FTIR DE PROTEÍNAS

AVALIAÇÃO DE ADULTERAÇÃO DE MISTURAS BIODIESEL DIESEL EMPREGANDO ESPECTROSCOPIA NO INFRAVERMELHO E ANÁLISE POR COMPONENTES PRINCIPAIS

Modelagem e Simulação Material 02 Projeto de Simulação

Aplicação do algoritmo genético na análise de medicamentos anti-inflamatórios industrializados

DESENVOLVIMENTO DE UM SOFTWARE NA LINGUAGEM R PARA CÁLCULO DE TAMANHOS DE AMOSTRAS NA ÁREA DE SAÚDE

STATGEN Plataforma web para análise de dados genéticos.

MONITORAMENTO DA EXPANSÃO DE POLIURETANAS POR TÉCNICAS DE ANÁLISE DE IMAGEM

Estudo de Casos Estudo de Caso 1: Velocidade Intervalar e Espessura da Camada

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE GOIÁS Curso Superior de Tecnologia em Análise e Desenvolvimento de Sistemas

APLICAÇÕES DA DERIVADA

Introdução a Química Analítica. Professora Mirian Maya Sakuno

Santa Cruz do Sul, outubro de 2015.

Aplicação da técnica de infravermelho médio (MIR) na análise química imediata de carvão vegetal

PESQUISA OPERACIONAL: UMA ABORDAGEM À PROGRAMAÇÃO LINEAR. Rodolfo Cavalcante Pinheiro 1,3 Cleber Giugioli Carrasco 2,3 *

Aplicação do algoritmo genético na otimização da produção em indústrias de açúcar e álcool

Gerenciamento de Problemas

Tecnologia em Gestão Pública Desenvolvimento de Projetos - Aula 9 Prof. Rafael Roesler

Projeto de inovação do processo de monitoramento de safra da Conab

Projeto 2.47 QUALIDADE DE SOFTWARE WEB

Figura 1 Nível de maturidade em gerenciamento de projetos PMI. Fonte: Estudo de Benchmarking do PMI (2013)

CÁLCULO DE INCERTEZA EM ENSAIO DE TRAÇÃO COM OS MÉTODOS DE GUM CLÁSSICO E DE MONTE CARLO

APLICAÇÃO DA QUIMIOMETRIA PARA TRATAMENTO DE DADOS ESPECTRAIS GERADOS POR FTIR REFERENTES AO HERBICIDA GLIFOSATO EM SOLOS.

Tópico 11. Aula Teórica/Prática: O Método dos Mínimos Quadrados e Linearização de Funções

6 Construção de Cenários

Departamento de Química Inorgânica, Universidade Federal do Rio Grande do Sul. Av. Bento Gonçalves, CEP: Porto Alegre, RS, Brasil.

Universidade Federal de Goiás (CMEC/EEC/UFG), 2 Professor Titular do CMEC/EEC/UFG, epazini@eec.ufg.br

Uma Heurística para o Problema de Redução de Padrões de Corte

PO 19: ENSINO DE ÂNGULOS: O AUXÍLIO DA LOUSA DIGITAL COMO FERRAMENTA TECNOLÓGICA

Classificação da imagem (ou reconhecimento de padrões): objectivos Métodos de reconhecimento de padrões

Desenvolvimento de um software de gerenciamento de projetos para utilização na Web

OBJETIVO 2 APLICAÇÃO 3 ATRIBUIÇÕES E RESPONSABILIDADES 4 DOCUMENTOS DE REFERÊNCIA 5 TERMINOLOGIA 6 DESCRIÇÃO DO PROCESSO DE GESTÃO DE MUDANÇAS

1 TÍTULO DO PROJETO DE TRABALHO Equipamento para Observação Didática e Análise da Influência da Temperatura de Cor sobre as Cores.

Cálculo Numérico Aula 1: Computação numérica. Tipos de Erros. Aritmética de ponto flutuante

IV Seminário de Iniciação Científica

Gerenciamento de Riscos em Segurança da informação.

Sistema para Visualização dos Resultados de Pesquisas de Clima Organizacional. PERSPECTIVA Consultores Associados Ltda.

Comparação do ganho de peso e desempenho de bezerras alimentadas com leite de descarte e leite normal durante a fase de aleitamento

PROCESSO DE DESENVOLVIMENTO DE SOFTWARE. Modelos de Processo de Desenvolvimento de Software

TÉCNICAS EXPERIMENTAIS APLICADAS EM CIÊNCIA DO SOLO

SERVIÇO DE ANÁLISE DE REDES DE TELECOMUNICAÇÕES APLICABILIDADE PARA CALL-CENTERS VISÃO DA EMPRESA

CONSIDERAÇÕES SOBRE A EXPERIMENTAÇÃO DE QUÍMICA NO ENSINO MÉDIO

Estratégia de Manutenção em Oficinas utilizando Caminho Critico

REMOÇÃO DE COR EM EFLUENTES INDUSTRIAIS

Fase de Análise de Requisitos. Engenharia de Software ANÁLISE DE REQUISITOS. Tipos de Requisitos. Tipos de requisitos. Tipos de requisitos

Márcia Patrícia Reis Melo, Raimundo Clecio Dantas Muniz Filho, Maria Izabel Maretti Silveira Bueno, Márcia Miguel Castro Ferreira *

O nosso trabalho. Desenvolver um sistema útil e robusto para aplicação em ambiente industrial/laboratorial. Objectivo

NCE/11/01396 Relatório preliminar da CAE - Novo ciclo de estudos

Módulo 4 PREVISÃO DE DEMANDA

4 Avaliação Econômica

Departamento de Matemática - UEL Ulysses Sodré. Arquivo: minimaxi.tex - Londrina-PR, 29 de Junho de 2010.

Sistema Básico de Inspeção Termográfica

INDICADORES FINANCEIROS NA TOMADA DE DECISÕES GERENCIAIS

Renzo Joel Flores Ortiz e Ilka Afonso Reis

PRIMAVERA RISK ANALYSIS

Aula 04 Método de Monte Carlo aplicado a análise de incertezas. Aula 04 Prof. Valner Brusamarello

3 Modelo Evolucionário para Sustentabilidade Inteligente

Fundamentos da Metrologia Científica e Industrial Ambiente Virtual: Balança Digital

Lista de Exercícios Espectrometria de Absorção Molecular ALGUNS EXERCÍCIOS SÃO DE AUTORIA PRÓPRIA. OS DEMAIS SÃO ADAPTADOS DE LIVROS CITADOS ABAIXO.

Correlação e Regressão Linear

DESEMPENHO DE ESPECTROFOTÔMETROS UV/VIS/IVP: EMPREGO DOS MATERIAIS DE REFERÊNCIA

Módulo 4. Construindo uma solução OLAP

ISO 9001:2008. Alterações e Adições da nova versão

SisDEA Home Windows Versão 1

Algoritmos não se aprendem: Copiando algoritmos Estudando algoritmos Algoritmos só se aprendem: Construindo algoritmos Testando algoritmos

TÍTULO: DESENVOLVIMENTO DE APLICATIVO PARA AVALIAÇÃO DOS ESFORÇOS EM LAJES

Desempenho da Fase Analítica. Fernando de Almeida Berlitz

O método de Monte Carlo: algumas aplicações na Escola Básica

Pisa 2012: O que os dados dizem sobre o Brasil

Copyright Proibida Reprodução. Prof. Éder Clementino dos Santos

Categoria: Pôster Eixo Temático Tecnologias SISTEMA TERRA: CRIAÇÃO, ADEQUAÇAO E USO DE INDICADORES DE SUSTENTABILIDADE NA USP

A Gestão, os Sistemas de Informação e a Informação nas Organizações

CURSO PROFISSIONAL TÉCNICO DE ANÁLISE LABORATORIAL

Geração e Interpretação de Mapas de Produtividade. Laboratório de Agricultura de Precisão II

Memória cache. Prof. Francisco Adelton

Processamento digital de imagens. introdução

MELHORAMENTO DE PLANTAS AUTÓGAMAS POR HIBRIDAÇÃO

Potencial de largura de banda de fibras multimodo

Aspectos Sociais de Informática. Simulação Industrial - SIND

definido por um documento de padronização. A Fig. 1 representa a organização dos Grupos de Processos juntamente com os documentos exigidos.

Estatística Básica via MySQL para Pesquisas On-Line

LISTA DE VERIFICAÇAO DO SISTEMA DE GESTAO DA QUALIDADE

CAP 254 CAP 254. Otimização Combinatória. Professor: Dr. L.A.N. Lorena. Assunto: Metaheurísticas Antonio Augusto Chaves

Processos de Desenvolvimento de Software

Eixo Temático ET Gestão de Resíduos Sólidos

MODIFICAÇÃO DO TESTE DE NORMALIDADE DE SHAPIRO-WILK MULTIVARIADO DO SOFTWARE ESTATÍSTICO R

Aula 08. Modelos e Simulação

Controle Faixa de numeração de controle (numeração de talão de vendas) dos pedido que deseja visualizar.

Hardware & Software. SOS Digital: Tópico 2

Desenvolvimento de metodologias no infravermelho aplicadas para a quantificação de cloridrato de metformina em formulações farmacêuticas

UNEMAT SISTEMA DE INFORMAÇÃO (SI) Professora: Priscila Pelegrini

CAP. 2 CONSIDERAÇÕES SOBRE OS CRITÉRIOS DE DECISÃO

MINERAÇÃO DE DADOS EDUCACIONAIS: UM ESTUDO DE CASO APLICADO AO PROCESSO SELETIVO DO IFSULDEMINAS CÂMPUS MUZAMBINHO

2. Método de Monte Carlo

7.Conclusão e Trabalhos Futuros

Modelagem e Simulação

Transcrição:

OTIMIZAÇÃO DE MODELOS DE REGRESSÃO MULTIVARIADOS VISANDO ESTIMAR O VALOR DE HIDROXILAS EM POLIÓIS DE ORIGEM PETROQUÍMICA E VEGETAL Daniela Fachini (UFRGS) danifachini@ig.com.br Rafael Bitello Silva (UFRGS) rafaelbitello@yahoo.com.br Luciano Marder (UNISC) lucmarder@yahoo.com.br Marco Flôres Ferrão (UNISC) ferrao@unisc.br Annelise Engel Gerbase (UFRGS) agerbase@ufrgs.br Este trabalho desenvolveu modelos de regressão multivariados visando estimar o valor de hidroxilas (OHV) em polióis tanto de origem petroquímica como vegetal (óleo de soja e de mamona). São comparados os desempenhos de modelos de regressão por mínimos quadrados parciais (PLS), por mínimos quadrados parciais por intervalo (ipls) e por mínimos quadrados parciais por sinergismo de intervalos (sipls), empregando dados obtidos pela espectroscopia por reflexão total atenuada no infravermelho (FT-IR/ATR). Os resultados obtidos para o algoritmo ipls mostraram que a seleção de parte do espectro é imprescindível para a obtenção de modelos de regressão multivariados visando a previsão do número de hidroxilas em polióis de origem petroquímica e vegetal a partir dos sinais dos espectros de reflexão total atenuada (FTIR-ATR). Não foi verificada melhora na capacidade preditiva dos modelos de calibração multivariada empregando-se a seleção de regiões do espectro através do algoritmo sipls. Todos os modelos que apresentaram bom desempenho na determinação do valor de hidroxilas selecionaram as regiões do espectro relacionadas quimicamente ao parâmetro em questão. Os resultados obtidos demonstram as potencialidades de desenvolvimento de metodologias analíticas mais limpas e rápidas para a análise de polióis de origem petroquímica e vegetal a partir do infravermelho, facilitando assim a especificação destes produtos na indústria. Palavras-chaves: Polióis, valor de hidroxilas, regressão por mínimos quadrados parciais, espectroscopia no infravermelho.

1. Introdução Nos últimos anos, o uso de fontes renováveis tem atraído muita atenção devido ao seu grande potencial em substituir derivados petroquímicos. Neste sentido, óleos vegetais, como o óleo de soja, tem encontrado uma grande aplicabilidade como excelente base para materiais poliméricos (MONTEAVARO et al., 2005). Os polióis oleoquímicos vem sendo usados, principalmente na produção de espumas, revestimentos, adesivos e poliuretanas termoplásticas (GUO, JAVNI & PETROVIC, 2000; PETROVIC, GUO & ZHANG, 2000; HU et al., 2002; GUO et al., 2002). Para a preparação destas poliuretanas é importante saber o valor de hidroxilas (OHV) do poliol empregado. Normalmente o OHV é determinado pelo método padrão da AOCS Cd 13-60 e o valor de hidroxilas é expresso em mg de KOH por g de óleo (American Oil Chemists Society, 1997). Embora este método seja confiável e reprodutível, se realizado sob condições padronizadas, apresenta alguns incovenientes como o uso de quantidades significativas de amostras e de reagentes químicos, entre os quais se destacam a piridina e o anidrido acético, que requerem um cuidado no seu manuseio por serem nocivos à saúde e os resíduos gerados da análise química devem ser tratados antes do seu descarte no meio ambiente. Recentemente, novas tecnologias de análise, como a espectroscopia no infravermelho com transformada de Fourier (FT-IR) associada aos métodos de regressão multivariados, têm sido propostas como alternativa atrativa aos métodos padrão de análise por ser uma técnica não destrutiva, de baixo custo, com um menor tempo de análise, além de utilizar pequenas quantidades de amostra e não gerar resíduos químicos (PARREIRA et al., 2002; AL-ALAWI & VAN DE VOORT, 2004). Além disso, as metodologias empregando FT-IR com reflexão total atenuada horizontal (ATR) simplificam muito os problemas de manejo das amostras, tornando mais acessíveis as rotinas de controle de qualidade industrial (BORIN & POPPI, 2004). Entre os métodos multivariados, a regressão por mínimos quadrados parciais (PLS) é o mais comum para construção de modelos usando sinais de espectros (GELADI & KOWALSKI, 1986). Em 1998, Spiegelman et al., demonstraram que a seleção da região espectral a ser modelada pode melhorar o desempenho dessa técnica de calibração em relação aos modelos que empregam o espectro inteiro. Regiões específicas (ou sinais infravermelhos) são selecionadas onde a colinearidade não está tão presente, gerando modelos mais robustos. Na prática, a otimização dos modelos de regressão multivariados, está baseada na identificação de subconjuntos dos dados completos (sub-regiões espectrais), que combinados ou não, minimizam os erros de predição. Visando desenvolver e otimizar uma metodologia analítica rápida e não destrutiva, capaz de estimar o OHV em polióis tanto de origem petroquímica como vegetal (óleo de soja e mamona) usando FT-IR/ATR, neste trabalho foram empregados e comparados os algoritmos de regressão multivariada por mínimos quadrados parciais (PLS), por mínimos quadrados parciais por intervalo (ipls) e por mínimos quadrados parciais por sinergismo (sipls). 2. Espectroscopia por Reflexão Total Atenuada A espectroscopia no infravermelho com transformada de Fourier (FT-IR) permite obter informações qualitativas e quantitativas rapidamente e, quando associada a reflectância total atenuada (ATR), simplifica a realização das análises (BORIN & POPPI, 2005). Na ATR a 2

amostra é colocada em contato com um elemento de reflexão interna (IRE) construído de um material com alto índice de refração, como por exemplo seleneto de zinco (ZnSe). Na Figura 1 é apresentado um esquema de como o processo de reflexão interna ocorre (MIRABELLA, 1985). n 2 Elemento De ATR θ E y0 E x0 Amostra n 3 E z0 Decaimento do Campo Evanescente z E/E 0 Figura 1 Representação da propagação da radiação infravermelha através do IRE (FERRÃO, 2000). 3. Mínimos quadrados parcias (PLS) No PLS a calibração multivariada é realizada utilizando a informação do espectro inteiro para construir um modelo da regressão, relacionado à propriedade de interesse. Por esta razão é chamado de método full-spectrum (BORIN & POPPI, 2005). Neste trabalho o PLS foi utilizado com o MATLAB, o qual integra computação matemática, visualização e linguagem eficiente em ambiente flexível para computação técnica. 3.1 Mínimos quadrados parcias por intervalo (ipls) Existem várias maneiras de selecionar a região espectral utilizando critérios objetivos, como por exemplo, avaliar a correlação da região selecionada com a o método de referência (R 2 ), ou avaliar a raiz quadrada dos erros médios de calibração cruzada (RMSECV), e ainda utilização de algoritmos que indicam o conjunto de variáveis espectrais que poderá dar melhores resultados com base no R 2 e/ou no RMSEP. Dentre os mais empregados encontram-se os métodos heurísticos como o algoritmo genético e a busca tabu, ou determinísticos como por exemplo o método de mínimos quadrados parciais por intervalo (Interval Partial Least- Squares ipls) (ZOU et al., 2007; ZOU, LI & ZHAO, 2007). O método ipls é uma extensão do PLS (NORGAARD et al., 2000), no qual divide-se o conjunto de dados (espectros) em um determinado número de intervalos, constrói-se o modelo PLS para cada intervalo, apresentando os resultados em um gráfico para facilitar a comparação. O método é planejado para dar uma visão geral dos dados e pode ser útil na interpretação de quais sinais do espectro são mais representativos na construção de um bom modelo de calibração. 3.2. Regressão por mínimos quadrados parciais por sinergismo de intervalos (sipls) Para relacionar os subintervalos, a fim de obter melhores habilidades preditivas, pode ser utilizado também, o algoritmo dos mínimos quadrados parciais por sinergismo de intervalos (sipls), (MUNK et al., 2001) uma extensão do ipls. Este possibilita selecionar a melhor 3

combinação de intervalos, combinando 2 a 2, 3 a 3 e até 4 a 4 sub-regiões do espectro, fornecendo geralmente melhores coeficientes de determinação e os menores erros de predição do que o ipls. 4. Material e métodos 4.1. Obtenção dos poliós de origem petroquímica e vegetal (óleo de soja e mamona) Para o desenvolvimento deste estudo foram empregadas 14 amostras de polióis de origem petroquímica e 19 de origem vegetal (óleo de soja e mamona). Os polióis petroquímicos foram doados pela Basf Poliuretanos Ltda (Mauá, SP, Brasil), sendo estes com diferentes OHV (na faixa de 28,0 a 584,5 mg KOH por grama de amostra). Os polióis vegetais (de óleo de soja e de óleo de mamona) foram doados pelo Instituto de Química da Universidade Federal do Rio Grande do Sul (UFRGS), sendo estes com diferentes OHV (na faixa de 22,2 508,0 mg KOH por grama de amostra). O OHV dos polióis de soja e mamona foram determinados pelo método padrão Cd 13 60 (AOCS, 1997). 4.2. Obtenção dos espectros no infravermelho Para obtenção dos espectros no infravermelho foi empregado um acessório de reflexão total atenuada horizontal com cristal de ZnSe da PIKE Technologies acoplado a um espectrofotômetro de infravermelho com transformada de Fourier NICOLET Magna 550. Os espectros foram obtidos na faixa de 4000 a 650 cm -1, com resolução de 4 cm -1 e 32 varreduras. Foi adquirido um espectro para cada amostra de poliol. 4.3. Construção do modelos multivariados O itoolbox para MATLAB (NORGAARD et al., 2000) foi usado para desenvolver os modelos multivariados de PLS, ipls e sipls. O programa foi rodado num IBM - compatível Intel Pentium 4 CPU 3.00 GHz e 1 Gb RAM microcomputador. Para calcular o erro dos modelos de calibração foi empregado o RMSE (Root Mean Square Error), conforme equação a seguir: RMSE = n i= 1 ( y yˆ ) 2 n onde n é o número de espectros, y i e ŷ i são os valores determinados pelo método padrão da AOCS e predito pelos modelos de calibração (PLS, ipls ou sipls), respectivamente, utilizando as amostras do conjuntos de calibração (RMSEC), de validação cruzada (RMSECV) ou de previsão (RMSEP). Calibração e validação cruzada: 24 espectros obtidos por FT-IR/ATR foram empregados para a construção dos modelos de calibração. As amostras com valores extremos de OHV foram incluídas no conjunto de calibração. Foram empregadas amostras tanto de poliol petroquímico como vegetal. Para a validação cruzada foi retirada uma amostra por vez e com as restantes é construído um modelo de calibração e prevista a amostra retirada. Este procedimento foi repetido até todas as 24 amostras terem sido previstas determinando-se assim o RMSECV que foi empregado para definir o número de variáveis latentes em todos os modelos. Previsão: 9 espectros obtidos por FT-IR/ATR foram empregados para avaliar o desempenho dos modelos de calibração, com os quais obteve-se o RMSEP. Foram empregadas amostras i i 4

tanto de poliol petroquímico como vegetal. 5. Resultados e discussões 5.1. Modelos ipls Com base no conjunto de dados foi desenvolvido inicialmente um modelo de regressão, empregando o método PLS, para a determinação do número de hidroxilas utilizando toda região espectral (650 cm -1 a 4000 cm -1 ), sendo os valores de RMSECV, RMSEP e RMSEC, bem como o número de variáveis latentes empregado (VLs), apresentado na Tabela 1. Estes resultados revelam que o modelo global tende a superestimar, uma vez que o valor do erro de previsão (RMSEP) é muito superior ao erro de calibração (RMSEC). Buscando otimizar a construção dos modelos de regressão multivariados empregando a regressão por mínimos quadrados parciais, a fim de obter modelos mais robustos, foram desenvolvidos novos modelos empregando o algoritmo ipls, dividindo a região espectral em 2, 3, 4, 5, 10, 15, 20 e 25 intervalos. Este procedimento faz com que partes do espectro sejam modeladas e assim pode-se selecionar a melhor região do espectro cujos sinais do espectro estejam relacionados de forma mais efetiva com o valor de hidroxilas presentes nos polióis de origem petroquímica e vegetal. Neste procedimento também se eliminam aquelas regiões do espectro que apresentam pouca informação sobre a propriedade em questão, diminuindo assim a maior parte da vulnerabilidade dos modelos de calibração que utilizam sinais espectroscópicos. Na Tabela 1 são apresentados os valores de RMSECV, RMSEP e RMSEC, o número de variáveis latentes empregado para cada um dos modelos ipls, bem como o intervalo (região do espectro) selecionado e que apresenta o menor erro de calibração cruzada (RMSECV) quando comparado com os demais. Todos os modelos ipls avaliados apresentam menores valores de erro que o modelo global, isto é, do que o modelo que utiliza todo o sinal dos espectros. Dentre estes pode-se destacar o ipls4, ipls5, ipls10 e ipls25 que apresentaram valores de RMSEP (erro de previsão) menores e na mesma ordem de grandeza que os valores de RMSEC (erro de calibração), sendo estes mais adequados para a previsão do número de hidroxilas para amostras de natureza semelhante aquelas empregadas neste trabalho. Modelo Intervalos Vls RMSECV a RMSEP a RMSEC a global TODOS 7 60,06 83,39 20,57 ipls2 2 5 45,11 29,80 32,36 ipls3 3 6 40,78 72,44 21,52 ipls4 4 6 35,23 21,69 23,13 ipls5 5 5 33,84 21,66 24,44 ipls10 9 6 33,20 26,10 23,46 ipls15 13 4 43,42 34,49 33,18 ipls20 17 3 42,34 32,85 34,66 ipls25 22 5 31,61 23,61 23,63 a Valores expressos em mg de KOH/g 5

Tabela 1 Resultados obtidos para os modelos ipls Na figura 2 são apresentados alguns dos gráficos comparativos para os modelos ipls, nos quais a linha tracejada representa o valor de RMSECV para o modelo global, empregando-se 7 variáveis latentes. As barras delimitam a subregião do sinal utilizado para cada intervalo e sua altura, o valor de RMSECV para o respectivo intervalo, considerando o número de variáveis latentes que encontra-se identificado na base de cada barra. Por exemplo, para o primeiro gráfico, que se refere ao ipls5 (o espectro dividido em 5 intervalos equidistantes), a primeira subregião (intervalo 1) apresenta elevado RMSECV, sendo este maior que o RMSECV do modelo global (linha tracejada), não sendo um bom modelo. Por outro lado, a última região (intervalo 5) apresenta o menor RMSECV, quando comparada as outras 4 subregiões (intervalos 1,2,3 e 4), e além disso, menor RMSECV que o modelo global (linha tracejada), sendo esta a melhor região do espectro quando o mesmo é subdividido em 5 intervalos. Comparando todos os 4 gráficos da Figura 2, onde varia-se o número de intervalos nos quais o sinal foi subdividido, podemos observar que sempre o melhor modelo de cada ipls utilizou parte do último sinal do espectro (uma banda larga), que está associada ao estiramento da ligação O-H presente nos polióis estudados (BARBOSA, 2007). Figura 2 Representação gráfica dos resultados para os modelos ipls de 4, 5, 10, 15, 20 e 25 intervalos 6

5.2. Modelos sipls De forma análoga aos modelos ipls que selecionam apenas 1 intervalo, foram desenvolvidos outros modelos de regressão empregando o algoritmo sipls, dividindo a região espectral em 5, 10, 15, 20 e 25 intervalos, seguido pela combinação de 2 ou 3 intervalos para o sipls de 5 intervalos e de 2, 3 e 4 intervalos para os demais. Todas as combinações possíveis não foram realizadas pois neste procedimento ocorre o que chamamos explosão combinatorial, cujo custo computacional não justifica o emprego do sipls para otimização de modelos de regressão multivariada, sendo neste caso mais adequado o uso de metaheurísticas, como algoritmo genético, para explorar de forma mais rápida as melhores soluções (combinações de intervalos) (KONZEN et al., 2003; LEARDI & NORGAARD, 2004). No sipls buscamos combinar os intervalos (subregiões do espectro), buscando verificar se a combinação de algumas destas resultam em sinergirmo, isto é, modelos com menor erro que os modelos obtidos com apenas um dos intervalos. Este procedimento é útil no caso dos sinais do espectro que sejam importante na construção dos modelos de regressão estarem em partes distintas do espectro. Os valores de RMSECV, RMSEP e RMSEC para todos os teste realizados, bem como para o modelo global, são apresentados na Tabela 2. Com base nestes resultados podemos destacar os modelos s2ipls15, s2ipls20 e s2ipls25 que apresentaram os menores erros de previsão (RMSEP), dentre os modelos sipls desenvolvidos. Observa-se que, apesar de alguns modelos sipls apresentarem RMSECV e RMSEC menores que os modelos ipls, nenhum destes apresentou menores erros de previsão (RMSEP) que os modelos ipls destacados inicialmente. Inclusive o s2ipls20 é o mesmo modelo que o ipls10, pois no s2ipls20 são selecionados os intervalos 17 e 18, que juntos equivalem ao intervalo 9 do modelo ipls10. Modelo Intervalos Vls RMSECV a RMSEP a RMSEC a FULL TODOS 7 60,06 83,39 20,57 s2ipls5 4 e 5 5 44,95 29,74 32,37 s3ipls5 2, 4 e 5 7 42,41 63,47 20,51 s2ipls10 3 e 9 7 31,48 86,14 16,15 s3ipls10 3, 9 e 10 7 31,44 85,94 16,13 s4ipls10 3, 8, 9 e 10 8 31,47 62,45 12,69 s2ipls15 12 e 13 7 33,06 25,24 21,23 s3ipls15 4, 13 e 14 6 32,24 61,14 21,49 s4ipls15 4, 12, 13 e 14 7 31,48 48,90 17,93 s2ipls20 17 e 18 6 33,20 26,10 23,46 s3ipls20 5, 17 e 18 6 32,71 41,67 21,02 s4ipls20 5, 6, 17 e 18 7 31,47 86,11 16,15 s2ipls25 20 e 22 6 32,91 25,37 22,83 7

5.3. Considerações finais s3ipls25 22, 24 e 25 6 27,18 29,49 8,84 s4ipls25 15, 16, 17 e 18 9 26,98 116,61 10,88 a Valores expressos em mg de KOH/g Tabela 2 Resultados obtidos para os modelos sipls Conforme apresentado, ambos os algoritmos de otimização conduzem na construção de modelos de calibração multivariada capazes de prever o valor de OH dos polióis petroquímicos e vegetais empregados. Porém, se aparentemente apenas uma parte do sinal dos espectros, que se refere ao estiramento O-H, é suficiente para modelar, o número de variáveis latentes igual a 5 ou superior poderia estar superestimando os resultados dos modelos. Podese justificar um número aparentemente alto de variáveis latentes para a determinação em questão, se compararmos o perfil e o valor do máximo de alguns dos espectros obtidos dos diferentes polióis analisados, conforme Figura 3. Pela análise da figura fica claro que não existe um único tipo de sinal para as hidroxilas, isto é, para os polióis estudados temos sinais diferentes no espectro que precisam ser modelados simultaneamente para obter um modelo representativo, e consequentemente um maior número de variáveis latentes se faz necessário. 1.0 0.9 3359 0.8 3371 3413 0.7 3382 3452 Log(1/R) 0.6 0.5 3390 3425 3479 3504 0.4 0.3 0.2 0.1 0.0 3200 3400 3600 Wavenumbers (cm-1) 6. Conclusões Figura 3 Região do estiramento da ligação O-H de alguns dos polióis analisados Os resultados obtidos para o algoritmo ipls mostraram que a seleção de parte do espectro, para a construção de modelos de regressão por mínimo quadrados parciais, permite a obtenção de modelos de regressão multivariados para a previsão do número de hidroxilas em polióis de origem petroquímica e vegetal utilizando-se os sinais dos espectros de reflexão total atenuada (FTIR-ATR). De uma forma geral para os melhores modelos obtidos os intervalos (regiões do espectro) selecionadas pelo algoritmo sipls foram equivalentes aquelas selecionadas pelo ipls, podendo-se neste caso optar por qualquer umas das estratégias de otimização. 8

Finalmente pode-se dizer que a seleção do sinal do espectro mais relacionada com a quantificação do número de hidroxilas é fundamental no desenvolvimento de metodologias analíticas mais limpas e rápidas para a análise de polióis de origem petroquímica e vegetal, facilitando assim a especificação destes produtos na indústria. Agradecimentos Este trabalho teve o apoio financeiro da CAPES, CNPq e da FAPERGS. Os autores ainda agradecem a Basf Poliuretanos Ltda (Mauá, SP, Brasil) e Vinícius Bassanesi Veronese do Instituto de Química da Universidade Federal do Rio Grande do Sul (UFRGS) pela doação das amostras empregadas neste estudo. Referências AL-ALAWI, A. & VAN DE VOORT, F.R. New method for the quantitative determination of free fatty acids in oil by FTIR spectroscopy. Journal of the American Oil Chemists' Society. Vol. 81, p. 441-446, 2004. AMERICAN OIL CHEMISTS SOCIETY. Official Methods and Recommended Practices of de American Oil Chemists Society, 4th edn, Champaing, 1993, revised 1997. BARBOSA, L.C.A. Espectroscopia no infravermelho na caracterização de compostos orgânicos. Viçosa: Editora Universidade Federal de Viçosa, 2007. BORIN, A. & POPPI, R.J. Multivariate Quality Control of Lubricating Oils Using Fourier Transform Infrared Spectroscopy. Journal of the Brazilian Chemical Society. Vol. 15, n.4, p. 570-576, 2004. BORIN, A. & POPPI, R.J. Application of mid infrared spectroscopy and ipls for the quantification of contaminants in lubricating oil. Vibrational Spectroscopy. Vol. 37, p. 27-32, 2005. FERRÃO, M.F. Aplicação de técnicas espectroscópicas de reflexão no infravermelho no controle de qualidade de farinha de trigo. Ph.D Thesis, Instituto de Química, Universidade Estadual de Campinas, Campinas, 2000. GELADI, P. & KOWALSKI, B.R. Partial Least-Squares Regression: A Tutorial. Analytica Chimica Acta. Vol. 185, p. 1-17, 1986. GUO, A.; DEMYDOV, D.; ZHANG, W. & PETROVIC, Z.S. Polyols and Polyurethanes from Hydroformylation of Soybean Oil. Journal of Polymers and the Environment. Vol. 10, p.49-52, 2002. GUO, A.; JAVNI, I. & PETROVIC, Z.S. Rigid polyurethane foams based on soybean oil. Journal of Applied Polymer Science. Vol. 77, n.2, p. 467-473, 2000. HU, Y.H.; GAO, Y.; WANG, D.N.; HU, C.P.; ZU, S.; VANOVERLOOP, L. & RANDALL, D. Rigid polyurethane foam prepared from a rape seed oil based polyol. Journal of Applied Polymer Science. Vol.84, n.3, p. 591-597, 2002. KONZEN, P.H.A.; FURTADO, J.C.; CARVALHO, C.W.; FERRÃO, M.F.; MOLZ, R.F; BASSANI, I.A. & HÜNING, S.L. Otimização de métodos de controle de qualidade de fármacos usando algoritmo genético e busca tabu. Pesquisa Operacional. Vol. 23, n. 1, p. 189-207, 2003. LEARDI, R. & NORGAARD, L. Sequential application of backward interval partial least squares and genetic algorithms for the selection of relevant spectral regions. Journal of Chemometrics. Vol. 18, n. 11, p. 486-497, 2004. MIRABELLA, F.M.Jr. Internal reflection spectroscopy. Applied Spectroscopy Reviews Vol. 21, p. 45-178, 1985. MONTEAVARO, L. L.; RIEGEL, I. C.; PETZHOLD, C. L. & SAMIOS, D. Thermal Stability of Soy-based Polyurethanes. Polímeros: Ciência e Tecnologia. Vol. 15, n. 2, p. 151-155, 2005. MUNCK, L.; NIELSEN, J.P.; MOLLER, B.; JACOBSEN, S.; SONDERGAARD, I.; ENGELSEN, S.B.; NORGAARD, L.; BRO, R. Exploring the phenotipyc expression of a regulatory proteome-altering gene by spectroscopy and chemometrics. Analytica Chimica Acta. Vol. 446, p. 171-186, 2001. NORGAARD, L.; SAUDLAND, A.; WAGNER, J.; NIELSEN, J.P. & MUNCK, L. Interval Partial Least- 9

Square Regression (ipls): A comparative Chemometric Study with an Example from near-infrared spectroscopy. Applied Spectroscopy. Vol. 54, n. 3, p. 413-419, 2000. PARREIRA, T.F.; FERREIRA, M.M.C; SALES H.J.S & ALMEIDA, W.B. Quantitative Determination of Epoxidized Soybean Oil Using Near Infrared Spectroscopy. Applied Spectroscopy, Vol. 54, p. 1607-1614, 2002. PETROVIC, Z.S.; GUO, A. & ZHANG, W. Structure and properties of polyurethanes based on halogenated and nonhalogenated soy-polyols. Journal of Polymer Science Part A: Polymer Chemistry. Vol. 38, n.22, p. 4062-4069, 2000. SPIEGELMAN, C. H.; MCSHANE, M. J.; COTÉ, G. L.; GOETZ, M. J.; MOTAMEDI, M. & YUE, Q. L. Theoretical justification of wavelength selection in PLS calibration: development of a new algorithm. Analytical Chemistry. Vol. 70, p. 35-44, 1998. ZOU, X.; ZHAO, J.; HUANG, X. & LI, Y. Use of FT-NIR spectrometry in non-invasive measurements of soluble solid contents (SSC) of Fuji apple based on different PLS models. Chemometrics and Intelligent Laboratory Systems. Vol. 87, n.1, p. 43-51, 2007. ZOU, X.; LI, Y. & ZHAO, J. Using genetic algorithm interval partial least squares selection of the optimal near infrared wavelength regions for determination of the soluble solids content of Fuji apple. Journal of Near Infrared Spectroscopy. Vol. 15, n.3, p. 153-159, 2007. 10