Redes neurais aplicadas na identificação de variedades de soja

Redes neurais aplicadas na identificação de variedades de soja Fábio R. R. Padilha Universidade Regional do Noroeste do Estado do Rio Grande do Sul - UNIJUÍ Rua São Francisco, 5 - Sede Acadêmica, 987-, Ijuí - RS - Brasil E-mail: roneipadilha@yahoo.com.br Oleg A. Khatchatourian Universidade Regional do Noroeste do Estado do Rio Grande do Sul - UNIJUÍ Rua São Francisco, 5 - Sede Acadêmica, 987-, Ijuí - RS - Brasil E-mail: olegkha@unijui.edu.br. Introdução A padronização de sementes de soja através do tamanho tem se tornado uma prática rotineira no Brasil e uma exigência de mercado (Lima, 996). A análise morfológica de grãos de soja é caracterizada por procedimentos técnicos utilizados para avaliar a identidade da amostra, ou seja, a verificação da pureza em um lote de sementes quanto à presença de sementes invasoras. De acordo com as Regras para Análise de Sementes (992), a quantidade de sementes analisadas em um laboratório é muito pequena em relação ao tamanho do lote ao qual representa. Se este não for homogêneo ou se houver erro na amostragem, as informações serão incorretas e comprometedoras, podendo beneficiar ou prejudicar os usuários das sementes analisadas. O processo de identificação em sementes de soja é um problema de identificação de padrões. Atualmente, isto é realizado por inspeção visual, uso de produtos químicos e testes de DNA, com alto custo. Para resolver este problema, foram utilizadas Redes Neurais Artificiais (RNA) para auxiliar neste tipo de procedimento. 2. Processamento das Imagens O processamento das imagens foi dividido em cinco etapas: aquisição da imagem, pré-processamento, segmentação, representação, reconhecimento e interpretação (Gonzales, 2). Na primeira etapa, as sementes das variedades pré-selecionadas foram colocadas sobre uma superfície plana de cor preta e fosca. Os grãos foram fotografados por uma câmera digital Coolpix995 da marca Nikon, acoplada a um tripé e ângulo de captação superior reto de 9º, com resolução fina de 28 x 96 pixels sob luz fluorescente. A câmera foi conectada a um adaptador que converteu as imagens em uma saída USB que por sua vez foi conectado ao computador onde as imagens foram salvas em formato JPEG. A partir da segunda etapa foram executados procedimentos no software MATLAB 7. através da ferramenta desenvolvida. 2 4 6 8 2 4 6 8 2 Figura : Imagem original A imagem a ser processada (Figura ), foi inserida ao programa onde na etapa de préprocessamento foi realizada uma suavização em tons de cinza (Figura 2). 2 4 6 8 2 4 6 8 2 Figura 2: Imagem em tons de cinza Este procedimento retornou uma matriz, onde cada posição representa um pixel e seu valor, um tom de cinza do referido pixel.

Na próxima etapa foi realizada a segmentação, onde se utilizou o Método de Prewitt para detecção dos contornos dos grãos (Figura 3). 2 4 6 8 2 4 6 8 2 Figura 3: Bordas detectadas pelo Método de Prewitt Contudo, o resultado não foi satisfatório, apresentando contornos fracos e descontínuos. Assim, foi necessário realizar uma dilatação desses contornos (Figura 4). da imagem resultante as características para a identificação das variedades. Para isto, aplicou-se um método que retornou as coordenadas de cada pixel e uma numeração seqüencial para cada grão (Figura 8). 2 4 6 8 2 4 6 8 2 Figura 5: Preenchimento dos grãos 2 4 6 2 8 4 6 2 4 6 8 2 Figura 6: Limpeza das bordas dos grãos 8 2 4 6 8 2 Figura 4: Dilatação dos contornos A dilatação dos contornos ainda resultou em alguns contornos descontínuos, então foi aplicada uma função que preencheu todos os grãos que possuíam os contornos contínuos (Figura 5). Devido à dilatação dos contornos, alguns grãos perderam suas características, dificultando a identificação dos padrões nas etapas posteriores. Por isto, realizou-se uma limpeza das bordas dos grãos reduzindo a dilatação realizada anteriormente (Figura 6). Finalizando esta etapa foi realizada a remoção de ruídos (aglomerados com até 7 pixels) que poderiam ser considerados como objetos a serem identificados, mas que por sua vez, não representavam os grãos e sim algum tipo de interferência na imagem (Figura 7). Após a segmentação, iniciou-se a etapa de representação onde foram extraídas 2 4 6 8 2 4 6 8 2 Figura 7: Remoção de objetos menores que 7 pixels 2 4 6 8 6 29 35 5 2 3 4 5 47 23 27 37 2 8 44 33 49 9 8 4 22 26 4 3 46 6 9 25 2 32 36 42 39 43 5 3 7 3 2 28 48 34 45 4 7 24 38 2 4 6 8 2 Figura 8: Imagem com os grãos identificados

Através destas coordenadas, extraíram-se da imagem os pixels de cada grão identificados por uma matriz. Devido aos diferentes formatos dos grãos, foram obtidas matrizes de dimensões variadas. Assim, foi realizada uma varredura nestas matrizes a fim de se identificar a maior dimensão entre elas. Feito isto, as matrizes menores foram preenchidas com zeros para igualar a dimensão entre elas. Após este procedimento, cada grão foi definido em termos de valores binários em um grid de dimensão 3 x 3 pixels. A Figura 9 mostra o esquema de um grão de soja através de uma matriz em um grid de tamanho 3 x 3 pixels. transformadas em vetores colunas para que pudessem ser inseridas como dados de entrada na rede neural da próxima etapa. 3. Configuração da Rede Neural Segundo Haykin (2) a arquitetura da rede neural utilizada para o tipo de reconhecimento de padrões verificada neste trabalho é a rede feedforward multicamadas com aprendizado backpropagation (Figura 2). A rede foi composta por 69 neurônios na camada de entrada, 3 camadas ocultas com 9, 7 e 6 neurônios e uma camada de saída com 8 neurônios. As camadas ocultas e a camada de saída possuíam biases. 4. Treinamento da Rede Neural Figura 9: Representação do grão através da matriz Os dados inseridos na rede foram limitados entre os valores (cor preta) e (cor branca) como pode ser observado na Figura. Figura : Imagem binária do grão de soja Para obter os dados de entrada, os padrões de treinamento foram submetidos à fase de pré-processamento que resultou uma matriz de dimensão 69 por 5, onde cada coluna representa um grão reconhecido no conjunto de treinamento descrito na fase de representação. Os vetores objetivos (Figura ) foram representados por uma matriz de dimensão 5 por 8, onde cada coluna representa uma saída desejada para cada grão (vetor unitário da base canônica) e as linhas os padrões a serem treinados. A posição do elemento igual corresponde ao padrão correto. BRS 33 BRS 84 CD 25 CD 26 EMB 48 NK 835 RS MSOY 8RR Figura : Vetores objetivos Finalizando esta etapa, as matrizes correspondentes a cada grão foram

Figura 2: Arquitetura da rede neural 5. Treinamento do Algoritmo O procedimento para ajustar os pesos da rede neural (treinamento do algoritmo) envolveu três fases: a propagação do vetor de entrada, a retropropagação do erro e o ajuste dos pesos. Designando W como a matriz dos pesos para a ª camada oculta, o vetor de entrada a para a 2ª camada oculta foi calculado da seguinte forma: 9x 9x69 69x 9x a = f W p + b () onde: p é o vetor de entrada (conjunto de treinamento), b é a bias e f é a função de transferência (sigmóide binária). Seguindo para a próxima camada, tem-se o vetor dos pesos multiplicado pelo vetor de saída da ª camada, caracterizando a propagação da rede e assim para a 3ª camada de acordo com as equações (2) e (3): ( 2) ( 2) 7x 7x9 9x 7x a = f W a + b (2) ( 3) ( 2) ( 3) 6x 6x7 7x 6x a = f W a + b (3) Continuando a etapa feedforward, o ( 4) vetor de saída a para a camada de saída foi calculado da seguinte forma: ( 4) ( 3) ( 4) 8x 8x6 6x 8x a = f V a + b (4) onde: V é a matriz de pesos para camada de saída. Durante a etapa de retropropagação (backpropagation), os pesos da rede foram ajustados para minimizar o erro quadrático total, determinado pela diferença entre o peso atual e o peso da saída da rede. A condição de parada inclui a tolerância na relação total do erro quadrático e no limite de iterações impostas (épocas). A rede neural foi considerada treinada quando os valores de saída estavam dentro do erro estipulado (,). Para os 5 vetores de entrada foram necessárias 352 épocas. 6. Resultados A rede neural após atingir o treinamento foi submetida aos primeiros testes utilizando 8 imagens contendo as amostras das variedades escolhidas. Os resultados são mostrados nas Tabelas a 8. Imagem analisada: Variedade BRS 33 BRS 33 5 34,9% BRS 84 4 9,9% CD 25 22,72% CD 26 % EMB 48 4 9,9% NK 835 9 2,45% RS % MSOY 8RR 2 4,55% Total 44 % Tabela : Análise da imagem BRS33.jpg

Imagem analisada: Variedade BRS 84 BRS 33 7 4,29% BRS 84 27 55,% CD 25 4 8,6% CD 26 2,4% EMB 48 % NK 835 2,4% RS 6 2,24% MSOY 8RR 3 6,2% Total 49 % Tabela 2: Análise da imagem BRS84.jpg Imagem analisada: Variedade CD 25 BRS 33 9 23,8% BRS 84 7 7,95% CD 25 4 35,9% CD 26 % EMB 48 5 2,82% NK 835 3 7,69% RS % MSOY 8RR 2,56% Total 39 % Tabela 3: Análise da imagem CD25.jpg Imagem analisada: Variedade CD 26 BRS 33 % BRS 84 3 6% CD 25 % CD 26 27 54% EMB 48 % NK 835 % RS 6 32% MSOY 8RR 4 8% Total 5 % Tabela 4: Análise da imagem CD26.jpg Imagem analisada: Variedade EMB 48 BRS 33 9 8,37% BRS 84 3 6,2% CD 25 5,2% CD 26 % EMB 48 2 4,82% NK 835 2 24,49% RS % MSOY 8RR % Total 49 % Tabela 5: Análise da imagem EMB.jpg Imagem analisada: Variedade NK 835 BRS 33 8 7,2% BRS 84 2,3% CD 25 4 8,5% CD 26 % EMB 48 5 3,9% NK 835 9 4,43% RS % MSOY 8RR % Total 47 % Tabela 6: Análise da imagem NK835.jpg Imagem analisada: Variedade RS BRS 33 % BRS 84 4 8% CD 25 % CD 26 22% EMB 48 % NK 835 % RS 29 58% MSOY 8RR 6 2% Total 5 % Tabela 7: Análise da imagem RS.jpg Imagem analisada: Variedade MSOY 8RR BRS 33 3 6,38% BRS 84 4 8,5% CD 25 2 4,26% CD 26 4 8,5% EMB 48 % NK 835 % RS 2,3% MSOY 8RR 33 7,2% Total 47 % Tabela 8: Análise da imagem MSOY8RR.jpg

Em outro teste, foram tiradas fotos separadas em grupos contendo 5,, 5, 2, 25, 3 e 35 grãos para cada variedade a fim de identificar o número de sementes necessárias para a confiabilidade do modelo (Figura 3). Figura 3: Imagens para avaliação da RNA As Figuras 4 a 2 mostram os gráficos resultantes do reconhecimento em relação aos grupos de fotos, os quais ilustram a freqüência de reconhecimento e também uma linha de tendência para cada caso..9.8.7.6.5.4.3.2. 5 5 2 25 3 35 4 Figura 4: Influência do tamanho do estrato BRS 33.9.8.7.6.5.4.3.2. 5 5 2 25 3 35 4 Figura 5: Influência do tamanho do estrato BRS 84.9.8.7.6.5.4.3.2. 5 5 2 25 3 35 4 Figura 6: Influência do tamanho do estrato CD 25.9.8.7.6.5.4.3.2. 5 5 2 25 3 35 4 Figura 7: Influência do tamanho do estrato CD 26.9.8.7.6.5.4.3.2. 5 5 2 25 3 35 4 Figura 8: Influência do tamanho do estrato EMB 48

.9.8.7.6.5.4.3.2. 5 5 2 25 3 35 4 Figura 9: Influência do tamanho do estrato NK 835.9.8.7.6.5.4.3.2. 5 5 2 25 3 35 4 Figura 2: Influência do tamanho do estrato RS.9.8.7.6.5.4.3.2. 5 5 2 25 3 35 4 Figura 2: Influência do tamanho do estrato MSOY 8RR 7. Conclusões Redes Neurais Artificiais em conjunto com Processamento de Imagens Digitais podem ser usadas para a identificação de variedades de soja. O modelo usado foi configurado por uma rede feedforward multicamadas com aprendizado backpropagation. Durante os testes realizados, a rede neural apresentou resultados satisfatórios, obtendo uma média de acerto acima de um terço do total de grãos analisados por variedade. Além disso, observou-se que com o aumento do número de grãos por foto ocorreu uma melhora considerável na identificação. Os resultados mostraram que o modelo foi capaz de identificar as variedades de soja e que as simulações realizadas permitiram escolher a arquitetura de RNA (número de camadas e de neurônios) com um bom desempenho. Referências [] N. M. Carvalho, J. Nakagawa, Sementes: Ciência, Tecnologia e Produção. 4. ed. Jaboticabal: Funep, 2. [2] R. C. Gonzales, R. E. Woods, Processamento de Imagens Digitais. Ed. Edgard Blücher - LTDA, São Paulo - SP, 2. [3] S. Haykin, Redes neurais: princípios e prática. 2.ed., traduzido por Paulo Martins Engel, Porto Alegre: Bookman, 2. [4] R. M. Lima, Efeito do tamanho das sementes sobre alguns atributos fisiológicos e agronômicos. Associação brasileira dos produtores de sementes: Anuários Abrasem, Brasília, DF, p. 39-43, 996. [5] MATLAB Versão 7., Neural Network Toolbox 4.., Release Notes. The MathWorks, 24. [6] Ministério da Agricultura e Reforma Agrária, Brasil, Regras para análise de sementes. Brasília: SNDA/DNDV/CLAV, 365 p., 992. [7] M. A. Shahin, S. J. Symons, V. W. POYSA, Determining soya bean seed size uniformity with image analysis. Biosystems Engineering (26) 94(2), 9-98.