Análise de correspondência aplicada ao estudo da qualidade de cafés especiais Mariele Vilela Bernardes Prado 1 Renato Ribeiro de Lima 1 Flávio Meira Borém 2 1 Introdução O café, uma das bebidas mais populares do mundo, é cultivada em mais de 80 países, nas regiões tropicais e sub-tropical do mundo. No Brasil, Minas Gerais aparece como o maior produtor nacional de café, com uma produção estimada de 52% para safra 2012 (CONAB, 2012). Devido a sua importância, a produção de café tem sido alvo de diversas pesquisas, muitas dessas ligadas a sua qualidade. A qualidade do café pode ser relacionada a diversos conceitos, sendo os mais habituais relacionados a fatores como clima, solo, altitude, sistema de produção e beneficiamento. Saber como esses fatores influenciam na qualidade do café e de que forma ocorre essa influência é fundamental para a produção de cafés especiais. Seguindo essa ideia, produtores da face mineira da Serra da Mantiqueira, onde são produzidos alguns dos cafés especiais de Minas Gerais, buscam associar a qualidade dos cafés a fatores relacionados a clima, solo, altitude, sistema de produção e beneficiamento presentes na região. Uma forma de entender essa relação é através da técnica multivariada de dados chamada análise de correspondência (AC). A análise de correspondência é uma técnica que busca representar a relação existente entre um conjunto de dados através de análises gráficas. As categorias das variáveis são representadas por pontos em um diagrama de dispersão de tal forma que suas posições relativas indicam a associação entre elas (Greenacre, 2007). Assim, este trabalho tem o intuito de atestar, através da análise de correspondência, tais relações entre a qualidade do café produzido na face mineira da microrregião da Serra da Mantiqueira com as características particulares da região. 2 Material e métodos Os dados utilizados neste trabalho foram obtidos junto aos responsáveis por um projeto multi-institucional, que tem o objetivo de coletar informações técnico-científicas com o 1 DEX UFLA. e-mail: mari_bernardes@yahoo.com.br 2 DEG UFLA. 1
intuito de monitorar a qualidade do café produzido na microrregião da Serra da Mantiqueira em Minas Gerais. As informações são referentes a nota final obtida na análise sensorial e diferentes combinações dos fatores: altitude (<1000m, 1000-1200m, >1200m), vertente (face soalheira e contra face), cor do fruto (vermelho e amarelo) e processamento (natural e descascado) de amostras de café coletadas nos anos de 2010 e 2011, sendo 120 amostras em cada ano. As análises sensoriais foram realizadas por um grupo de quatro degustadores usando a metodologia da Associação Americana de Cafés Especiais (SCAA). Essas notas, que variam de 75 a 100, foram categorizadas seguindo especificações da SCAA em 5 grupos: Bom, com notas de 75 a 79; Muito bom, de 80 a 84; Excelente, de 85 a 89; Excepcional, de 90 a 94 e Exemplar, de 95 a 100. Para avaliar a associação entre notas e as características em estudo foi utilizada a análise de correspondência. Esse método tem como base a decomposição do valor singular de uma matriz (tabela de contingência ajustada) em que é possível representar graficamente linhas de uma tabela de contingência como pontos em um espaço vetorial reduzido. Através dos gráficos é possível verificar visualmente se as variáveis em estudo se afastam ou aproximam do pressuposto de independência (Le Roux e Rouanet, 2010). A matriz, chamada matriz indicadora, foi elaborada tendo nas linhas as amostras de café e nas colunas os fatores em estudo com suas categorias. Essa matriz possui os elementos na forma de variáveis dummy, ou seja, quando for 1, o objeto i é classificado na categoria j da variável q, e 0, caso contrário. O objeto i só pode pertencer a uma categoria para cada variável. Foi elaborada uma matriz indicadora para a análise sensorial de cada ano (Greenacre e Blasius, 2006). Para aplicação da AC, as matrizes indicadoras referentes a cada ano foram concatenadas de forma que as linhas representem as amostras e as colunas as categorias dos fatores, sendo estas, repetidas em cada ano. Essa forma de concatenação resulta na chamada matriz super indicadora do tipo Broad (Heijden, 1987). As análises foram feitas utilizando-se o software R (R Development Core Team, 2011). 3 Resultados e discussões A partir da análise do gráfico de correspondência das notas finais nos dois anos, pode-se perceber que não ocorreu alteração na localização das notas dos anos de 2010 e 2011. Nos dois anos estudados, as melhores notas encontram-se no quadrante inferior esquerdo do gráfico (Figura 1), enquanto que as menores, ao lado oposto em relação à primeira dimensão. 2
Figura 1 Gráfico de correspondência das notas finais ao longo de dois anos Bom(B), Muito Bom(MB), Excelente(EXL), Excepcional(EXC), Exemplar (EXP). Na figura 2, tem-se o gráfico de concentração das amostras de café quanto aos fatores estudados, no qual observa-se como as amostras se agrupam. Os pontos concentrados no quadrante inferior esquerdo do gráfico representam as melhores amostras de café, classificadas como excepcional e exemplar, conforme foi visto na Figura 1. Também é possível observar a divisão das amostras em três grupos distintos. O primeiro grupo, alocado mais a esquerda, dividido entre os quadrantes inferior e superior esquerdo é composto por amostras provenientes de altitudes superiores a 1200 metros e frutos amarelos. O segundo grupo, alocado no quadrante inferior esquerdo é formado por amostras originadas de altitudes superiores a 1200 metros e frutos vermelhos. As amostras provenientes de altitudes inferiores a 1200 metros formam o terceiro grupo. A forma como as amostras se distribuíram confirma o resultado apresentado por Silva et al. (2008) de que maiores altitudes produzem cafés com as melhores características. A partir do gráfico de correspondência dos fatores (Figura 3), observa-se os tipos de processamento como o fator que menos influencia nas notas. Isto é explicado pela proximidade do fator com o centroide, uma vez que quanto mais próximos ao centroide, menor é a sua contribuição. Logo, altitude é o fator com maior influencia nas notas, seguida pela cor do fruto e vertente. Os pontos referentes a altitudes superiores a 1200 metros estão próximos dos pontos referentes às melhores notas, indicando que os melhores cafés são produzidos acima de 1200 m. Da mesma forma, altitudes inferiores a 1000 metros e notas 3
classificadas como boas, encontram-se no quadrante inferior direito, confirmando a relação direta existente entre menores altitudes e baixa qualidade de cafés especiais. Figura 2 Mapa da concentração de 120 amostras de café quanto aos fatores em estudo. Figura 3 Gráfico de correspondência dos fatores estudados - Bom(B), Muito Bom(MB), Excelente(EXL), Excepcional(EXC), Exemplar (EXP), Descascados(DES), Natural(NAT), Amarelo(AM), Vermelho(VER), Face Soalheira (SO), Contra Face(CF), Altitudes menores que 1000m(1), entre 1000 e 1200m(2), maiores que 1200m(3). 4
4 Conclusões O uso da análise de correspondência mostrou-se eficiente para analisar a relação de dependência entre as notas das analises sensoriais e os fatores altitude, processamento, cor do fruto e vertente. Analisando a posição dos fatores nos gráficos de correspondência foi possível perceber que altitudes mais elevadas produzem cafés com maior qualidade. A cor amarela apresentou uma influência menor, mas ainda considerável. Os demais fatores, vertente e processamento, não apresentaram efeitos tão evidentes. 5 Referências [1] Companhia Nacional de Abastecimento CONAB. Acompanhamento da Safra Brasileira Café. Disponível em: http://www.conab.gov.br/. Acesso em 06 de fevereiro de 2012. [2] GREENACRE,M. Correspondence Analysis in Practice, second edition: Boca Raton: Chapman & Hall/CRC. 2007. 274p. [3] GREENACRE,M.J., BLASIUS,J. (eds.) Multiple Correspondence Analysis and Related Methods. Boca Raton: Chapman & Hall/CRC. 2006. 581p. [4] HEIJDEN, P. G. M. van der. Correspondence analysis of longitudinal categorical data. Tese de Doutorado: Universidade de Leiden, Holanda. [5] LE ROUX, B., ROUANET, H. Multiple Correspondence Analysis. Series: Quantitative Applications in the Social Sciences. Sage, Thousand Oaks, London. 2010. 116p. [6] R DEVELOPMENT CORE TEAM. R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. Disponível em: <http://www.r-project.org>. Acesso em: Fevereiro 2012. [7] SILVA, V., PEREIRA, R., BORÉM, F., FERREIRA, D.. Qualidade do Café Produzido em Diferentes Altitudes do Sul de Minas Gerais e Processado por Via Seca. Revista em Agronegócio e Meio Ambiente, América do Norte, 1, ago. 2008. 5