Redes neurais aplicadas na identificação de variedades de soja Fábio R. R. Padilha Universidade Regional do Noroeste do Estado do Rio Grande do Sul - UNIJUÍ Rua São Francisco, 5 - Sede Acadêmica, 987-, Ijuí - RS - Brasil E-mail: roneipadilha@yahoo.com.br Oleg A. Khatchatourian Universidade Regional do Noroeste do Estado do Rio Grande do Sul - UNIJUÍ Rua São Francisco, 5 - Sede Acadêmica, 987-, Ijuí - RS - Brasil E-mail: olegkha@unijui.edu.br. Introdução A padronização de sementes de soja através do tamanho tem se tornado uma prática rotineira no Brasil e uma exigência de mercado (Lima, 996). A análise morfológica de grãos de soja é caracterizada por procedimentos técnicos utilizados para avaliar a identidade da amostra, ou seja, a verificação da pureza em um lote de sementes quanto à presença de sementes invasoras. De acordo com as Regras para Análise de Sementes (992), a quantidade de sementes analisadas em um laboratório é muito pequena em relação ao tamanho do lote ao qual representa. Se este não for homogêneo ou se houver erro na amostragem, as informações serão incorretas e comprometedoras, podendo beneficiar ou prejudicar os usuários das sementes analisadas. O processo de identificação em sementes de soja é um problema de identificação de padrões. Atualmente, isto é realizado por inspeção visual, uso de produtos químicos e testes de DNA, com alto custo. Para resolver este problema, foram utilizadas Redes Neurais Artificiais (RNA) para auxiliar neste tipo de procedimento. 2. Processamento das Imagens O processamento das imagens foi dividido em cinco etapas: aquisição da imagem, pré-processamento, segmentação, representação, reconhecimento e interpretação (Gonzales, 2). Na primeira etapa, as sementes das variedades pré-selecionadas foram colocadas sobre uma superfície plana de cor preta e fosca. Os grãos foram fotografados por uma câmera digital Coolpix995 da marca Nikon, acoplada a um tripé e ângulo de captação superior reto de 9º, com resolução fina de 28 x 96 pixels sob luz fluorescente. A câmera foi conectada a um adaptador que converteu as imagens em uma saída USB que por sua vez foi conectado ao computador onde as imagens foram salvas em formato JPEG. A partir da segunda etapa foram executados procedimentos no software MATLAB 7. através da ferramenta desenvolvida. 2 4 6 8 2 4 6 8 2 Figura : Imagem original A imagem a ser processada (Figura ), foi inserida ao programa onde na etapa de préprocessamento foi realizada uma suavização em tons de cinza (Figura 2). 2 4 6 8 2 4 6 8 2 Figura 2: Imagem em tons de cinza Este procedimento retornou uma matriz, onde cada posição representa um pixel e seu valor, um tom de cinza do referido pixel.
Na próxima etapa foi realizada a segmentação, onde se utilizou o Método de Prewitt para detecção dos contornos dos grãos (Figura 3). 2 4 6 8 2 4 6 8 2 Figura 3: Bordas detectadas pelo Método de Prewitt Contudo, o resultado não foi satisfatório, apresentando contornos fracos e descontínuos. Assim, foi necessário realizar uma dilatação desses contornos (Figura 4). da imagem resultante as características para a identificação das variedades. Para isto, aplicou-se um método que retornou as coordenadas de cada pixel e uma numeração seqüencial para cada grão (Figura 8). 2 4 6 8 2 4 6 8 2 Figura 5: Preenchimento dos grãos 2 4 6 2 8 4 6 2 4 6 8 2 Figura 6: Limpeza das bordas dos grãos 8 2 4 6 8 2 Figura 4: Dilatação dos contornos A dilatação dos contornos ainda resultou em alguns contornos descontínuos, então foi aplicada uma função que preencheu todos os grãos que possuíam os contornos contínuos (Figura 5). Devido à dilatação dos contornos, alguns grãos perderam suas características, dificultando a identificação dos padrões nas etapas posteriores. Por isto, realizou-se uma limpeza das bordas dos grãos reduzindo a dilatação realizada anteriormente (Figura 6). Finalizando esta etapa foi realizada a remoção de ruídos (aglomerados com até 7 pixels) que poderiam ser considerados como objetos a serem identificados, mas que por sua vez, não representavam os grãos e sim algum tipo de interferência na imagem (Figura 7). Após a segmentação, iniciou-se a etapa de representação onde foram extraídas 2 4 6 8 2 4 6 8 2 Figura 7: Remoção de objetos menores que 7 pixels 2 4 6 8 6 29 35 5 2 3 4 5 47 23 27 37 2 8 44 33 49 9 8 4 22 26 4 3 46 6 9 25 2 32 36 42 39 43 5 3 7 3 2 28 48 34 45 4 7 24 38 2 4 6 8 2 Figura 8: Imagem com os grãos identificados
Através destas coordenadas, extraíram-se da imagem os pixels de cada grão identificados por uma matriz. Devido aos diferentes formatos dos grãos, foram obtidas matrizes de dimensões variadas. Assim, foi realizada uma varredura nestas matrizes a fim de se identificar a maior dimensão entre elas. Feito isto, as matrizes menores foram preenchidas com zeros para igualar a dimensão entre elas. Após este procedimento, cada grão foi definido em termos de valores binários em um grid de dimensão 3 x 3 pixels. A Figura 9 mostra o esquema de um grão de soja através de uma matriz em um grid de tamanho 3 x 3 pixels. transformadas em vetores colunas para que pudessem ser inseridas como dados de entrada na rede neural da próxima etapa. 3. Configuração da Rede Neural Segundo Haykin (2) a arquitetura da rede neural utilizada para o tipo de reconhecimento de padrões verificada neste trabalho é a rede feedforward multicamadas com aprendizado backpropagation (Figura 2). A rede foi composta por 69 neurônios na camada de entrada, 3 camadas ocultas com 9, 7 e 6 neurônios e uma camada de saída com 8 neurônios. As camadas ocultas e a camada de saída possuíam biases. 4. Treinamento da Rede Neural Figura 9: Representação do grão através da matriz Os dados inseridos na rede foram limitados entre os valores (cor preta) e (cor branca) como pode ser observado na Figura. Figura : Imagem binária do grão de soja Para obter os dados de entrada, os padrões de treinamento foram submetidos à fase de pré-processamento que resultou uma matriz de dimensão 69 por 5, onde cada coluna representa um grão reconhecido no conjunto de treinamento descrito na fase de representação. Os vetores objetivos (Figura ) foram representados por uma matriz de dimensão 5 por 8, onde cada coluna representa uma saída desejada para cada grão (vetor unitário da base canônica) e as linhas os padrões a serem treinados. A posição do elemento igual corresponde ao padrão correto. BRS 33 BRS 84 CD 25 CD 26 EMB 48 NK 835 RS MSOY 8RR Figura : Vetores objetivos Finalizando esta etapa, as matrizes correspondentes a cada grão foram
Figura 2: Arquitetura da rede neural 5. Treinamento do Algoritmo O procedimento para ajustar os pesos da rede neural (treinamento do algoritmo) envolveu três fases: a propagação do vetor de entrada, a retropropagação do erro e o ajuste dos pesos. Designando W como a matriz dos pesos para a ª camada oculta, o vetor de entrada a para a 2ª camada oculta foi calculado da seguinte forma: 9x 9x69 69x 9x a = f W p + b () onde: p é o vetor de entrada (conjunto de treinamento), b é a bias e f é a função de transferência (sigmóide binária). Seguindo para a próxima camada, tem-se o vetor dos pesos multiplicado pelo vetor de saída da ª camada, caracterizando a propagação da rede e assim para a 3ª camada de acordo com as equações (2) e (3): ( 2) ( 2) 7x 7x9 9x 7x a = f W a + b (2) ( 3) ( 2) ( 3) 6x 6x7 7x 6x a = f W a + b (3) Continuando a etapa feedforward, o ( 4) vetor de saída a para a camada de saída foi calculado da seguinte forma: ( 4) ( 3) ( 4) 8x 8x6 6x 8x a = f V a + b (4) onde: V é a matriz de pesos para camada de saída. Durante a etapa de retropropagação (backpropagation), os pesos da rede foram ajustados para minimizar o erro quadrático total, determinado pela diferença entre o peso atual e o peso da saída da rede. A condição de parada inclui a tolerância na relação total do erro quadrático e no limite de iterações impostas (épocas). A rede neural foi considerada treinada quando os valores de saída estavam dentro do erro estipulado (,). Para os 5 vetores de entrada foram necessárias 352 épocas. 6. Resultados A rede neural após atingir o treinamento foi submetida aos primeiros testes utilizando 8 imagens contendo as amostras das variedades escolhidas. Os resultados são mostrados nas Tabelas a 8. Imagem analisada: Variedade BRS 33 BRS 33 5 34,9% BRS 84 4 9,9% CD 25 22,72% CD 26 % EMB 48 4 9,9% NK 835 9 2,45% RS % MSOY 8RR 2 4,55% Total 44 % Tabela : Análise da imagem BRS33.jpg
Imagem analisada: Variedade BRS 84 BRS 33 7 4,29% BRS 84 27 55,% CD 25 4 8,6% CD 26 2,4% EMB 48 % NK 835 2,4% RS 6 2,24% MSOY 8RR 3 6,2% Total 49 % Tabela 2: Análise da imagem BRS84.jpg Imagem analisada: Variedade CD 25 BRS 33 9 23,8% BRS 84 7 7,95% CD 25 4 35,9% CD 26 % EMB 48 5 2,82% NK 835 3 7,69% RS % MSOY 8RR 2,56% Total 39 % Tabela 3: Análise da imagem CD25.jpg Imagem analisada: Variedade CD 26 BRS 33 % BRS 84 3 6% CD 25 % CD 26 27 54% EMB 48 % NK 835 % RS 6 32% MSOY 8RR 4 8% Total 5 % Tabela 4: Análise da imagem CD26.jpg Imagem analisada: Variedade EMB 48 BRS 33 9 8,37% BRS 84 3 6,2% CD 25 5,2% CD 26 % EMB 48 2 4,82% NK 835 2 24,49% RS % MSOY 8RR % Total 49 % Tabela 5: Análise da imagem EMB.jpg Imagem analisada: Variedade NK 835 BRS 33 8 7,2% BRS 84 2,3% CD 25 4 8,5% CD 26 % EMB 48 5 3,9% NK 835 9 4,43% RS % MSOY 8RR % Total 47 % Tabela 6: Análise da imagem NK835.jpg Imagem analisada: Variedade RS BRS 33 % BRS 84 4 8% CD 25 % CD 26 22% EMB 48 % NK 835 % RS 29 58% MSOY 8RR 6 2% Total 5 % Tabela 7: Análise da imagem RS.jpg Imagem analisada: Variedade MSOY 8RR BRS 33 3 6,38% BRS 84 4 8,5% CD 25 2 4,26% CD 26 4 8,5% EMB 48 % NK 835 % RS 2,3% MSOY 8RR 33 7,2% Total 47 % Tabela 8: Análise da imagem MSOY8RR.jpg
Em outro teste, foram tiradas fotos separadas em grupos contendo 5,, 5, 2, 25, 3 e 35 grãos para cada variedade a fim de identificar o número de sementes necessárias para a confiabilidade do modelo (Figura 3). Figura 3: Imagens para avaliação da RNA As Figuras 4 a 2 mostram os gráficos resultantes do reconhecimento em relação aos grupos de fotos, os quais ilustram a freqüência de reconhecimento e também uma linha de tendência para cada caso..9.8.7.6.5.4.3.2. 5 5 2 25 3 35 4 Figura 4: Influência do tamanho do estrato BRS 33.9.8.7.6.5.4.3.2. 5 5 2 25 3 35 4 Figura 5: Influência do tamanho do estrato BRS 84.9.8.7.6.5.4.3.2. 5 5 2 25 3 35 4 Figura 6: Influência do tamanho do estrato CD 25.9.8.7.6.5.4.3.2. 5 5 2 25 3 35 4 Figura 7: Influência do tamanho do estrato CD 26.9.8.7.6.5.4.3.2. 5 5 2 25 3 35 4 Figura 8: Influência do tamanho do estrato EMB 48
.9.8.7.6.5.4.3.2. 5 5 2 25 3 35 4 Figura 9: Influência do tamanho do estrato NK 835.9.8.7.6.5.4.3.2. 5 5 2 25 3 35 4 Figura 2: Influência do tamanho do estrato RS.9.8.7.6.5.4.3.2. 5 5 2 25 3 35 4 Figura 2: Influência do tamanho do estrato MSOY 8RR 7. Conclusões Redes Neurais Artificiais em conjunto com Processamento de Imagens Digitais podem ser usadas para a identificação de variedades de soja. O modelo usado foi configurado por uma rede feedforward multicamadas com aprendizado backpropagation. Durante os testes realizados, a rede neural apresentou resultados satisfatórios, obtendo uma média de acerto acima de um terço do total de grãos analisados por variedade. Além disso, observou-se que com o aumento do número de grãos por foto ocorreu uma melhora considerável na identificação. Os resultados mostraram que o modelo foi capaz de identificar as variedades de soja e que as simulações realizadas permitiram escolher a arquitetura de RNA (número de camadas e de neurônios) com um bom desempenho. Referências [] N. M. Carvalho, J. Nakagawa, Sementes: Ciência, Tecnologia e Produção. 4. ed. Jaboticabal: Funep, 2. [2] R. C. Gonzales, R. E. Woods, Processamento de Imagens Digitais. Ed. Edgard Blücher - LTDA, São Paulo - SP, 2. [3] S. Haykin, Redes neurais: princípios e prática. 2.ed., traduzido por Paulo Martins Engel, Porto Alegre: Bookman, 2. [4] R. M. Lima, Efeito do tamanho das sementes sobre alguns atributos fisiológicos e agronômicos. Associação brasileira dos produtores de sementes: Anuários Abrasem, Brasília, DF, p. 39-43, 996. [5] MATLAB Versão 7., Neural Network Toolbox 4.., Release Notes. The MathWorks, 24. [6] Ministério da Agricultura e Reforma Agrária, Brasil, Regras para análise de sementes. Brasília: SNDA/DNDV/CLAV, 365 p., 992. [7] M. A. Shahin, S. J. Symons, V. W. POYSA, Determining soya bean seed size uniformity with image analysis. Biosystems Engineering (26) 94(2), 9-98.