UNIVERSIDADE FEDERAL DO PARANÁ Setor de Tecnologia Departamento de Engenharia Elétrica Programa de Pós Graduação em Engenharia Elétrica Processamento Digital de Sinais Documento técnico: Digital Image Processing (PROCEEDINGS OF THE IEEE, VOL. 63, NO. 4, APRIL 1975) Aluna: Tânia Evelyn Olivo Professor: Marcelo de Oliveira Rosa
1 Processamento Digital de Imagem. Neste artigo iremos tentar rever alguns dos mais importantes conceitos de processamento de imagem digital e, em seguida concentrar em duas áreas problemáticas (codificação e restauração). Nos sistemas ópticos a intensidade da luz radiante emitida ou refletida pelo objeto é capturada por um conjunto de lentes e aberturas. Em uma imagem radiográfica, as radiações nucleares passam por um objeto é passada por aberturas de radiação opaco e / ou pinholes. Figura 1:Esquema de um sistema de formação imagem O sistema de formação de imagem possui um comportamento global. Considere um ponto na imagem de plano, o ponto (x, y) na Figura 1. A imagem no ponto (x, y) é uma função das contribuições dos bairros em um (x 1, y 1 ). Representando a distribuição de energia radiante da imagem como g(x,y) e distribuição de energia radiante do objeto como f(x, y), a mais geral descrição de g é A função h é conhecida como Função Propagação do Ponto (Point Spread Function PSF), que envolve a distribuição do objeto como um argumento, permitindo processos não-lineares na formação da imagem. Uma hipótese é que a simplificação da função ponto de propagação apenas pesos, o objeto da distribuição como uma multiplicador escalar. Neste caso, a função ponto de propagação assume a forma: (1) e o resultado da equação formação de imagem é linear (2) posição: Fazendo a Função Propagação do Ponto ser invariante em função a (3) O que leva a uma convolução bidimensional (4)
Finalmente, assumindo h separável: (5) Leva a duas operações de uma dimensão na distribuição do objeto: (6) sendo a ordem de integração arbitrária. A equação 2 representa a formação de imagem em uma PSF de espaço variante; e a 4 um espaço invariante. Logo: Lentes têm a habilidade de realizar transformadas de Fourier; Um sistema de formação de imagem óptica pode ser descrito pela equação 4, como um modelo espaço invariante. h, na equação 4, é a transformada de Fourier da saída de luz coerente, e a transformada de Fourier da função auto-correlação da saída em luz incoerente. (7) (8) Figura 2: Ativa a penetração radioativa imagem formação Figura 3: Passiva radiacao penetrante da imagem formação...sistemas de penetração de radiação para formação de imagens podem ser ativos ou passivos. Em um sistema ativo, o objeto a ser retratado é por si só uma fonte de radiação nuclear (nêutrons, raios gamma, raio-x), e para formar a imagem precisamos de um pinhole, como na Figura 2. O principio é o mesmo que o do orifício da câmera ótica. A imagem que se forma pode ser descrita pela equação (4). Cálculo de h associada ao orifício tornam-se difíceis, porém, pela natureza penetrante da radiação.
2 Processos Digital de Imagem. A gravação de imagens pode ser dividida entre: fotoquímica (utilizada em filmes fotográficos) e fotoelétrica (câmera de televisão). Os filmes fotográficos dependem das propriedades dos sais haletos de prata para gravar imagens, que tem suas características mudadas devido à exposição à luz. A ação dos agentes redutores (desenvolvedores) resulta em deposição de prata livre. Figura 4: Tipica filme curva de resposta. A massa de prata depositada é linearmente proporcional ao logaritmo da exposição E, definida como o tempo integral de intensidade de luz no intervalo de exposição. Existe também uma região de saturação (onde toda a prata é depositada), e também uma região nebulosa (onde se verifica o depósito de alguma prata mesmo sem luz). Uma relação é mostrada na curva D=logE. Sendo D a densidade óptica, I 1 a intensidade da fonte de referência e I 2 a intensidade de luz transmitida ou refletida pelo filme quando iluminado pela fonte de referência. ( I 1 é sempre maior do que I 2 ). O filme é meio de gravação de intensidades de luz, mas que está sujeito a ruídos, que no filme provém da aleatoriedade na formação de grãos de prata. O ruído de filme granulado (Film-grain noise), adiciona densidade (e não intensidade). Sendo γ o declive da região linear, I o a intensidade da imagem, a imagem somada ao ruído é gravada em densidade: (10) Na formação fotoelétrica, a imagem é varrida por um feixe de elétrons, e a saída é em função do feixe atual. Observa-se que a saída também está sujeita a interferências de ruído. Em muitas câmeras, existe uma regra entre entradasaída, descrita como a relação do logaritmo de saída da câmera contra o logaritmo de entrada de intensidade de luz; tal relação é referenciada como gamma do sensor de imagem.
Figura 5: Esquema representação da imagem formação e gravação. A figura 5 representa um diagrama de blocos da formação e gravação de imagem. Onde o sistema h tem memória; é uma operação linear ou não-linear na forma de 1, 2, 4,7 ou 8. O sistema s não tem memória, mas representa não-linearidades na gravação da imagem. O termo n adicionado à s é um processo aleatório, que conta os ruídos inevitáveis de gravação. n é tido como um processo de ruído-branco gaussiano para o film grain-noise. Muitas vezes podemos supor que s é função logarítmica. Uma intensidade de imagem é definida como uma imagem representada por valores linearmente proporcionais à intensidade da energia radiante original da formação da imagem. Já a densidade de imagem é definida como uma imagem na qual os valores são proporcionais ao logaritmo da intensidade da energia radiante original. 3 Amostragem e quantização de imagem. A imagem uma vez gravada, precisa ser amostrada e suas amostras quantizadas em um dado número de bits. Erros de quantização equivalem à adição de processos aleatórios ao dado. Em um processamento digital de sinal de uma dimensão, aliasing pode ser evitado com o uso de um filtro passa-baixa colocado em zero na frequência de Nyquist. No Teorema de Nyquist a quantidade de amostras por unidade de tempo de um sinal, chamada taxa ou freqüência de amostragem, deve ser maior que o dobro da maior freqüência contida no sinal a ser amostrado, para que possa ser reproduzido integralmente sem erro de aliasing. A metade da freqüência de amostragem é chamada freqüência de Nyquist e corresponde ao limite máximo de freqüência do sinal que pode ser reproduzido. Como não é possível garantir que o sinal não contenha sinais acima deste limite, é necessário filtrar o sinal com um filtro passa-baixa com freqüência de corte igual (ou menor) a freqüência de Nyquist, ou filtro anti-aliasing. Em processamento de digital de imagem, a função análoga não é tão facilmente cumprida. Podemos fazer uma cópia da imagem original fora de foco, o que por outro lado adicionaria film-grain noise de banda larga. 4 Reconstrução e visualização de Imagens digitais Sistemas de reconstrução de imagens são como os sistemas de amostragem. Uma luz é projetada no filme inexposto e a intensidade mostrada é modulada como o dado digital requer.
Considerando fidelidade de imagem, se uma dada intensidade de transmitância ou densidade é representada por um número digital, então a fidelidade máxima implica que a visualização irá mostrar o mesmo valor original de transmitância e densidade como no computador. Na situação ideal, em implicaria em uma relação entrada/saída, como mostrada na figura 6a; porém na prática, temos a figura 6b, onde a característica real desvia 45º da ideal. Pode ser feita uma linearização de acordo com os passos: O dado é coletado nas características de entrada/saída do display gerado no computador, em determinados graus de transmitância ou densidade, a graduação é enviada ao display e a verdadeira resposta de visualização para cada valor é determinada. Na figura 6b, a característica é, e a característica linear é dada por ; esta transformação pode ser conseguida com o método do polinômio dos mínimos quadrados, com os dados anteriores. Antes de mostrar qualquer imagem é transformada pela função, técnicas de linearização são aplicadas com sucesso, representando a etapa de calibração na conversão digital-analógica de dados que não é usualmente encontrada no processamento unidimensional digital de sinal com circuitos em condições de linearidade. 5 Restauração Digital de Imagem A restauração de imagens é um campo com tanta atividade quanto a sua codificação. A figura 5 pode descrever o problema de restauração da imagem; pegando a imagem gravada e processada para obter de alguma maneira, uma estimativa da distribuição de energia radiante do objeto f; o estimado da distribuição de energia radiante é referenciado a imagem restaurada. No caso de uma imagem de gravação média ideal, o bloco s da figura 5 pode ser o mapeamento de identidade e o ruído termo n pode ser sempre zero. Num caso ideal, o problema de restauração pode se reduzir a uma integral como 1, 2 ou 4 para a função f. Mas isto é difícil, pois a equação subjacente é mal-condicionada. A restauração da imagem pode ser vista como a escolha do filtro inverso para o PSF (point spread function); produzindo os dados originais quando a imagem degradada é processada pelo filtro. No filtro inverso a função degradação é invertida, e utilizada para restaurar a imagem.
Fontes de degradação existentes para as quais a restauração digital de imagem é procurada são: motion-blur, óptica fora de foco, e borrão (imagem desfocada) devido à turbulência atmosférica. A FFT (Transformada rápida de Fourier) torna viável a solução numérica de grandes sistemas lineares presentes em problemas de restauração digital invariantes no espaço. O emprego de FFT não afeta o comportamento de sistemas malcondicionados. O mau comportamento é controlado por pressupostos feitos para desenvolver uma técnica particular de restauração. Não há solução única dado o comportamento mal-condicionado e a existência de ruído; ao invés, existe uma infinita gama de soluções, e precisa-se de um critério que determine qual é a solução ótima. Para que a transformada de Fourier possa ser computada, a PSF (point-spread function) precisa ser conhecida. Restaurações do filtro de Wiener têm lacunas que exigem extensivas informações a priori, como a PSF e conhecimentos detalhados da imagem e função auto-covariante de ruído. Comparando as quatro técnicas de restauração mais simples (filtro inverso, filtro de Wiener, estimativa de mínimos quadrados condicionado, filtro homomórfico) temos: Relação sinal ruído; Correlação de imagem e ruído; Informação a priori. O filtro homomórfico exige menos informação, pois pode realizar a restauração a partir da própria imagem degradada. Em seguida temos a estimativa de mínimos quadrados condicionada, que exige a PSF (point-spread function); a variância de ruído também é necessária, mas pode ser estimada a partir da imagem degradada. O que exige mais informação a priori é o filtro de Wiener: a PSF, mais as funções correlação do sinal e ruído. Qualidade visual da imagem restaurada Vê-se o mau desempenho do filtro de Wiener, se comparado aos outros. A otimização de Wiener vem da teoria linear, e o sistema visual humano percebe imagens com conhecidos efeitos não-lineares, e provavelmente outros ainda desconhecidos. A estrutura logarítmica do filtro homomórfico torna-o preferível, tendo em conta a resposta logarítmica do olho humano. O desempenho desejável dos mínimos quadrados condicionado não é explicado pela teoria atual. Filtragem linear, com um filtro passa-alta, é útil para revelar estrutura e detalhes da imagem, por exemplo; filtragem passa-baixa é geralmente usada para suprimir ruído; filtragem notch é usada para eliminar efeitos de ruídos periódicos( filtros notch são filtros capazes de rejeitar uma faixa bastante estreita de freqüências, assim sua utilização é recomendada quando o sinal a ser atenuado é bem definido). Histograma de equalização pode ser relacionado em uma teoria de informação, senso para geração de imagem que tem máxima entropia. Outras técnicas, que se mostraram úteis: processamento homomórfico para faixa de compressão dinâmica com filtragem linear, a técnica de "crispening"; processamento não-linear da transformada de Fourier em magnitude com a fase inalterada, o processamento alpha de Andrews; mapeamento de intensidade ou densidade de imagem em uma tela colorida (pseudocolor); retificação de distorções geométricas conhecidas; geração de contornos de imagem, etc.
6 Modelo visual simples em restauração de imagem Os métodos homomórficos de Stockham Cole e Cannon geram restaurações satisfatórias. Se tivermos todas as informações podemos utilizar o filtro ótimo (Wiener) que, porém tem sua utilidade questionada como descrito antes. No meio termo temos a estimativa de mínimos quadrados condicionado, que requer somente a forma da PSF. Sabe-se que o sistema visual humano percebe o logarítmo de intensidade da luz incidente que entra no olho. A percepção humana registra níveis de iluminação que enquadram desde uma noite sem lua, ao sol de meio dia em um campo de neve, com uma gama de intensidade de oito ordens de grandeza. O sistema visual humano também age como um filtro espacial de freqüência. Existe um limite para a freqüência espacial que pode ser percebida a certa distância, pois ninguém vê com infinita resolução. Os olhos comportam-se como um filtro passa-baixa, sem nenhuma resolução para além de certo limite de alta freqüência. O sistema pesa as freqüências médias com mais ênfase do que as baixa ou altas. A Figura 7 ilustra a resposta da visão em função da freqüência. A resposta é assumida radialmente (circularmente) simétrica, sendo assim o gráfico uma intersecção no plano. A característica de subida das baixasfreqüências corresponde a um diferenciador com ênfase em gamas medianos. Se a intensidade incidente no olho for originada de uma imagem correlacionada, a função de covariância da imagem não é uma função de Dirac; a imagem percebida não deve ter a mesma correlação. O filtro linear visual (do olho) deve induzir uma nova correlação na imagem, e o espectro de força percebido deve ser multiplicado pela Figura 7.
Foi tentada restauração com filtro inverso, porém a natureza malcondicionada não resultou em imagem discernível; a aparência resultante foi o campo de ruído aleatório (randômico). Então a restauração pelo filtro de Wiener foi computada. O espectro de potência original foi computado e assumido um modelo seccionalmente polinomial exponencial para medir o espectro. O espectro do ruído também foi computado, e então a restauração de Wiener feita. Foi pressuposto pequeno-sinal (aproximação linear para logaritmo) e o processo feito no domínio da densidade. O resultado é visto na figura 10. O ruído pôde ser fortemente reduzido, mas não temos ganho de resolução observável. A próxima restauração foi a dos mínimos quadrados condicionado, com o pressuposto da máxima ignorância, sobre sinal e ruído; a imagem original e ruído foram assumidos como processos aleatórios incorrelacionados (branco). A restauração não pode ser feita até termos a freqüência de corte da figura 7. No experimento a freqüência de corte do modelo sistema visual foi adotado igual à freqüência de Nyquist da imagem amostrada na Figura 8, com 2,5 ciclos por mm para um raio de 200μm. O modelo de sistema visual será válido apenas para certa distância, pois a resolução é em função da distância do olho ao objeto, com a escolha da freqüência de corte na freqüência de Nyquist. Temos na figura 11 a imagem restaurada. Quando a figura 11 é vista da distância adequada, e com o corte do sistema visual localizado, fica evidente a superioridade da figura. 11 em relação a 10, e também em relação a 9; existe mais nitidez na figura. 11 se comparada a 9 e um número de detalhes finos mais visível em relação a 8. 7 Máxima estimativa a posteriori pela Imagem Digital Restaudada. A princípio pode parecer que o filtro de Wiener seja a melhor técnica de restauração quando se tem o máximo de informação a priori, mas isso não é verdade, uma vez que o filtro de Wiener é desenvolvido de um modelo linear, que é obtido de simplificações/aproximações que não consideram a resposta não-linear do filme ou sensores fotoelétricos. O vetor f (intensidade do objeto), também é assumido como amostra de um processo aleatório bidimensional subjacente. Foi escolhida uma média positiva como modelo para intensidades um processo flutuante gaussiano. Processo gaussiano gera valores negativos, independente de quão grande a média positiva. No entanto, se temos pouca variação em torno da média, uma boa parte dos valores é positiva, e o modelo torna-se razoável. Sabe-se por histogramas, que as intensidades podem às vezes ser modeladas por estatísticas gaussianas, e outras não; é um pressuposto assumido para
tratamento matemático. As intensidades f amostradas são descritas por densidade normal multivariada. Sabe-se pouco a priori, a média de f pode ser assumida como constante ou zero; mas se soubermos mais sobre a imagem restaurada, podemos usar como média a priori. Se a função s é uma transformada linear, então a matriz Sb vira uma matriz identidade, e (11) pode ser manipulada em uma forma que descreve o domínio do espaço com um filtro discreto de Wiener. Sabe-se da equivalência entre MAP e estimada MMSE para sistemas lineares e densidades simétricas. A equação 11 é uma matriz não-linear, com o vetor desconhecido em ambos os lados da equação. A solução para a estimativa MAP não é conhecida em geral, como as equações integrais não-lineares de Van Trees que não tem solução (11) em geral. Os esforços atuais focam em métodos para solução que sejam compatíveis com os requerimentos computacionais. 8 Conclusão. O domínio da restauração de imagem não é tão satisfatório intelectualmente quanto a sua codificação. Com técnicas mais sofisticadas de processamento, o autor acredita que se terá mais unidade intelectual. A estimativa MAP é a primeira a oferecer, uma equação para a imagem restaurada que mantém as características não-lineares da imagem gravada, a função 's' explícita na formulação. As relações entre estimativas MAP e MMSE já usadas são conhecidas em termos do modo e média das densidades condicionais. Para sistemas não-lineares estimativas MAP e MMSE são diferentes, mas muitas vezes tem-se certa equivalência. O uso do processamento digital de imagens consiste em melhorar o aspecto visual de certas feições estruturais para o analista humano e fornecer outros subsídios para a sua interpretação, inclusive gerando produtos que possam ser posteriormente submetidos a outros processamentos. A área de processamento digital de imagens tem atraído grande interesse nas últimas duas décadas. A maioria das técnicas envolve o tratamento da imagem como um sinal bi-dimensional, no qual são aplicados padrões de processamento de sinal. O Processamento Digital de Sinais é utilizado em qualquer área onde informações são manipuladas ou controladas por um processador digital.