Classificação de alimentos em relação à suas informações nutricionais por meio da Análise Multivariada Lucas Santana da Cunha 1 Sonia Maria de Stefano Piedade 2 1 Introdução A presença de informações nutricionais nos rótulos de alimentos, bem como a sua correta leitura e interpretação é importantíssima para que as pessoas possam fazer opções alimentares mais saudáveis. No Brasil, a Agência Nacional de Vigilância Sanitária (ANVISA), por meio da Resolução RDC nº 40, de 21 de março de 2001, elaborou a legislação que regulamenta a Rotulagem Nutricional Obrigatória de Alimentos e Bebidas Embalados. A publicação da nova regulamentação, sobre Rotulagem Nutricional de Alimentos Embalados, traz a expectativa de orientar o setor produtivo quanto às informações relevantes, possibilitar a revisão das formulações e informar o consumidor sobre a composição do alimento favorecendo escolhas que promovam o consumo de uma dieta mais equilibrada e saudável. É sabido que não basta que o sujeito tenha o conhecimento para colocá-lo em prática, mas este pode levá-lo a repensar seus atos e aos poucos modificar suas atitudes. Segundo Gonsalves (2001), é muito difícil eliminar todos os fatores de risco de nossa dieta e fazer escolhas cem por cento corretas e saudáveis, mas é possível utilizar o bom senso fazendo opções que propiciem um aumento no consumo de alimentos mais saudáveis e diminuição dos mais nocivos à nossa saúde. O objetivo desse trabalho é classificar os alimentos segundo suas informações nutricionais por meio da análise multivariada, utilizando-se as técnicas análise de componentes principais e análise de agrupamentos, despertando assim o interesse do consumidor de buscar conhecimento sobre a importância das informações nutricionais de cada alimento. 1 LCE ESALQ/USP. e-mail: ls_cunha@yahoo.com.br 2 LCE ESALQ/USP. e-mail: soniamsp@esalq.usp.br 1
2 Material e métodos Neste trabalho, foram utilizados dados nutricionais de 25 alimentos nacionais industrializados de maior consumo, sendo eles: bolacha recheada, bolacha maisena, bolacha de água e sal, arroz comum e parboilizado, pão de forma comum, light e integral, maionese, catchup, milho, ervilha, azeitona, feijão comum, rosinha e preto, soja, macarrão, miojo, sardinha, leite condensado, creme de leite, achocolatado, farinha de trigo e de rosca, milho para pipoca, queijo ralado, fubá e leite. Foram consideradas as informações nutricionais dadas como obrigatórias pela legislação da ANVISA, sendo elas: Valor Energético (VE), Carboidratos (Ca), Proteínas (Pr), Gorduras Totais (GT), Gorduras Saturadas (GS), Fibra Alimentar (FA) e Sódio (Sd). Foram observados os valores diários (VD), em porcentagem, das quantidades de nutrientes que uma pessoa deva consumir para uma dieta de 2000 Kcal ou 8400 KJ. Tais informações nutricionais referem-se ao produto na forma como está exposto à venda e são apresentadas em porções, e medidas caseiras correspondentes. Os dados foram examinados por meio da análise de componentes principais. Como as informações nutricionais de cada alimento são extraídas sobre diferentes unidades de medida, então se trabalhou com as variáveis estandardizadas, eliminado assim as diferenças na variação de cada alimento. Em seguida, foi construído agrupamentos entre as amostras de acordo com suas similaridades, utilizando todas as variáveis disponíveis, sendo representado de maneira bidimensional através de um dendrograma. Para análise dos componentes principais utilizou-se o procedimento PRINCOMP. Para a análise de agrupamentos, utilizaram-se os procedimentos PROC CLUSTER e PROC TREE. Ambos do software SAS (SAS INSTITUTE, 2002). 3 Resultados e discussões Pode-se observar a matriz de correlação obtida através da análise de componentes principais na Tabela 1, que houve alta correlação positiva entre as variáveis valor enérgico e carboidratos, e entre gordura total e saturada. Há uma correlação pouco menor, entre as variáveis valor energético e proteínas, e entre as variáveis sódio em relação às gorduras total e saturada. Para explicar a distribuição dos grupos, não será necessário um grande número de componentes, por possuir altas correlações entre as variáveis, podendo variar de acordo com a população estudada (MANLY, 2004). 2
Tabela 1 Matriz de correlação entre as variáveis utilizadas na análise de componentes principais Variável Variável VE Ca Pr GT GS FA Sd VE 1 Ca 0,8585 1 Pr 0,6355 0,3673 1 GT 0,4596 0,0011 0,3112 1 GS 0,3437-0.0181 0,1223 0,8353 1 FA 0,3341 0,3938 0,5949-0,2095-0,2452 1 Sd 0,4356 0,2192 0,0756 0,6731 0,6313-0,0903 1 Conforme se observa na Tabela 2, os três primeiros componentes principais explicaram 87,97% da variação total, quatro componentes apresentaram variância (autovalor) inferior a 0,7. Assim, as quatro variáveis podem ser descartadas de acordo como critério de Jolliffe (1972). Tabela 2 Autovalores, proporção individual e acumulada da variação dos dados por meio da análise dos componentes principais Componente Autovalor Proporção Individual Proporção Acumulada 1 3,0909 0,4416 0,4416 2 2,2129 0,3161 0,7577 3 0,8539 0,1220 0,8797 4 0,4806 0,0687 0,9483 5 0,2546 0,0364 0,9847 6 0,1019 0,0146 0,9992 7 0,0053 0,0008 1 Se os dois primeiros componentes principais explicam uma grande proporção da variação total, entre 70 a 80%, então isso será útil para plotar os valores dos escores dos componentes para cada indivíduo, ou seja, possibilita plotar os dados em duas dimensões, e assim, observar a possível formação de grupos. Observando os três primeiros componentes principais, o gráfico de dispersão mostrado na Figura 1, foi obtido por intermédio dos escores dos componentes principais 1 e 2, onde verificamos uma possível formação de grupos entre os feijões e o macarrão, e ainda, soja e miojo se diferem dos demais. 3
Figura 1 - Dispersão entre os escores do primeiro (CP1) e do segundo (CP2) componentes principais. A razão disso pode ser observada nos pesos das componentes principais: no primeiro componente o maior peso está no valor energético (0,51), no segundo componente o maior peso está na fibra alimentar (0,53). Para comprovar a formação desses possíveis grupos foi feito o dendograma, calculado pelo método do centróide (Figura 2), relativo à similaridade das frutas segundo as variedades escolhidas. Figura 2 - Dendrograma obtido da análise de agrupamento hierárquico utilizando as sete variáveis: calorias, glicídios, proteínas, lipídios, cálcio, fósforo e ferro. 4
Observa-se que são formados vários grupos pequenos com alta similaridade. Dentre eles estão os feijões carioca e rosinha (que não possuem diferença), arroz comum e parboilizado, farinha de rosca e fubá, catchup e maionese, pão de forma comum e bolacha de agua e sal. O miojo se distingue dos demais devidos seu alto teor de gordura total, gordura saturada e sódio. Já o grupo dos feijões se distingue devido ao alto teor de fibra alimentar existente nesses alimentos. 4 Conclusões Ficou claro que o miojo se distingue e muito dos demais alimentos, devido à grande quantidade de sódio. Isso também vale para o grupo de feijões, que difere bastante dos demais devido à grande quantidade de fibra alimentar que esse alimento possui. O arroz comum e parboilizado são idênticos em relação à quantidade de nutrientes presentes nesses alimentos, apesar do parboilizado ser mais caro que o comum. Evidências mais precisas sobre a qualidade dos alimentos há necessidade da visão do pesquisador da área, no caso, nutricionista. 5 Referências [1] GONSALVES, Paulo Eiró. Maus Hábitos Alimentares. São Paulo: Editora Agora, 2001. [2] JOHNSON, R. A.; WICHERN, D. W. Applied multivariate statistical analysis. 4 ed. NewJersey: Pratice Hall, 1998. 816p. [3] JOLLIFFE, I. T. Discarding variables in a principal component analysis. I. Artificial data.j. R. Stat., Soc., Serie C: Appl. Stat., London, v.21, n.2, p.160-173, 1972. [4] MANLY, B. F. J. Multivariate statistical methods a primer. 3 ed. London: Chapman & Hall/CRC, 2004. 208p. [5] SAS INSTITUTE. SAS Stat user s guide.version 9. Carry: SAS Institute, 2002. 5