Automação em Arquivos GERENCIAMENTO ELETRÔNICO DE DOCUMENTOS (GED) O que é GED GED é a tecnologia que provê um meio de facilmente armazenar, localizar e recuperar informações existentes em documentos e dados eletrônicos, durante todo o Ciclo de Vida documental. 1
PRINCIPAIS TIPOS DE GED Principais tipos de GED Mundo analógico Criação Revisão Processamento Arquivo Mundo digital As quatro operações (criação, revisão, processamento, arquivo) são realizadas tanto no mundo digital quanto no analógico. No entanto podem existir situações híbridas, como as apresentadas a seguir: 2
Principais tipos de GED Mundo analógico Criação Revisão Processamento Arquivo Mundo digital Um documento pode ser criado e revisado no computador e depois impresso, sendo processado e arquivado em papel; Um documento pode ser criado e revisado em papel e depois ser digitalizado, sendo processado e arquivado em meio digital Principais tipos de GED Document Management Document Imaging Mundo analógico Criação Revisão Processamento Arquivo Mundo digital Um sistema Document Imaging direciona esforços para o gerenciamento de documentos concluídos, independente se a origem deles é analógica ou digital; 3
DOCUMENT IMAGING Document Imaging Document Management Document Imaging Mundo analógico Criação Revisão Processamento Arquivo Mundo digital 4
Document Imaging Os objetivos de um sistema de Document Imaging são: Capturar/digitalizar documentos; Armazená-los em ambiente seguro; Recuperar esses documentos quando necessário; Permitir manipular esses documentos de acordo com os processos da empresa. Gerenciamento de Documentos DOCUMENT MANAGEMENT 5
O Gerenciamento de Documentos Analógico/Digital Document Management Document Imaging Mundo analógico Criação Revisão Processamento Arquivo Mundo digital Document Management Permite gerenciar um documento durante todo o seu ciclo de vida; Ambiente mais propício à pessoas que trabalham intensamente em computadores; Além das funções de Document Imaging, o Document Management inclui alguma funções: Controle de versões dos documentos; Uso de modelos de documentos predefinidos ou formulários eletrônicos; Integração com programas geradores de novos documentos; Gerenciamento de documentos em construção; Fluxos documentais; Suporte a diversos tipos documentais; 6
Gestão Eletrônica de Documentos - GED EDMS (ENGINEERING DOCUMENT MANAGEMENT SYSTEM) EDMS: conceito básico Propósito: Gerenciar documentos técnicos da empresa durante todo o Ciclo de Vida, seja na fase de implantação, seja durante a vida útil do empreendimento; Um EDMS é essencialmente um Document Management com algumas características adicionais para que possa manipular documentos técnicos; 7
Características dos documentos Características diferenciadas Temporalidade; Tamanho físico de documentos; Documentos sempre sujeitos a alterações; Visualização de documentos CAD e híbridos; Disponibilização de documentos em manutenção corretiva e operação; Integração com outros sistemas de engenharia; Custo do documento de engenharia; ERM 8
ERM Objetivo: Gerenciar relatórios de muitas páginas gerados pelos diversos sistemas da empresa; Os relatórios gerados pelos diversos sistemas existentes em uma empresa podem possuir milhares de páginas que podem ser tratadas como um único documento; Em um ERM esses relatórios são formatados e indexados de forma a ter uma aparência agradável ao usuário que fará uma busca. ERM: funções Transformar relatórios em um formato para consultas; Indexação Automática Pesquisa por índices Localização não somente dos relatórios desejados, mas também das páginas dentro do relatório; 9
Gestão Eletrônica de Documentos - GED PROCESSAMENTO DE FORMULÁRIOS FORM PROCESSING Processamento de Formulários: conceito Objetivo: minimizar o esforço e o custo na indexação e obtenção de dados que tradicionalmente seria feita por digitadores; Captura de dados de formulários A partir dos formulários são colhidos dados de maneira automática por meio de reconhecimento de padrões com OCR, ICR, OMR, código de barras etc; Os dados colhidos podem ser apenas para indexação da imagem do documento ou para a coleta de um grande volume de informações contidas nos formulários, como no caso do censo demográfico. 10
Tecnologias OCR, ICR, OMR Reconhecimento de Padrões Tecnologias OCR, ICR, OMR, BCR Tipos de fontes Impresso ou datilografado Manuscrito Marcas Código de Barras 11
OCR (Optical character recognition) Reconhecimento Óptico de Caractere Tecnologia para reconhecer caracteres a partir de um arquivo de imagem. Através do OCR é possível digitalizar uma folha de texto impresso e obter um arquivo de texto editável. ICR (Intelligent character recognition) Reconhecimento Inteligente de Caractere reconhecimento de caracteres impressos, manuscritos, etc; Utiliza tecnologia de redes neurais Seu desempenho no reconhecimento de caracteres melhora com o uso. 12
OMR (Optical Mark recognition) Reconhecimento Ótico de marcações Habilidade para detectar a presença de marcações representativas de algum tipo de informação OMR (Optical Mark recognition) 13
BCR (Bar Code Reader) Leitor de Código de Barras Conhecer/interpretar códigos em barra de dados BCR (Bar Code Reader) 14
Gerenciamento Eletrônico de Documentos AMBIENTE GED Preparação de documentos 15
Preparação de Documentos Quais documentos digitalizar? Eliminação: remoção e destruição de duplicatas, materiais sem importância e materiais com mias antigos que o seu tempo de retenção; Essa tarefa deve ser realizado com muita atenção por pessoas capacitadas para que se evite a destruição de documentos que, mais tarde, venham a ser importantes e valiosos; Documentos maiores do que a largura do scanner devem ser digitalizado separadamente; Limpeza dos documentos remoção de clipes, grampos, prendedores Preparação de Documentos Cores alguns documentos contém informações que não podem ser comunicadas em preto e branco. Exemplo: números de contabilidade que demonstram os valores negativos em vermelho; Organização dos discos ópticos (CD, DVD) Definir uma estratégia; Colocar os registros vitais ou permanentes ou permanentes em um disco; Colocar documentos com período de guarda de 25 anos; Documentos com período de guarda inferior a 7 anos; 16
Digitalização Digitalização Ordem de digitação ordem de chegada; agrupar logicamente os documentos lotes por tamanho e cor, minimizando os ajustes no scanner; Qualidade da imagem é medida em pontos por polegada (dpi dots per inch) quantos mais dpi mais a qualidade (legibilidade) da imagem resultante da digitalização quanto menor a qualidade, menor o tempo de digitalização; quanto maior a qualidade, maior o arquivo resultante a digitalização em cores resulta um arquivo muito maior que a digitalização em preto e branco 17
Digitalização Formato GIF - Graphic Interchange Format JPEG - Joint Photographic Experts Group TIFF - Tagged Image File Format PNG - Portable Networks Graphic Algumas dicas Para publicar na Web: JPEG, PNG, or GIF Para impressão: TIFF Formatos Digitalização Formulários pré-impressos Geralmente apenas as informações manuscritas, datilografadas ou impressas (não o formulário em si) são importantes; Dependendo das cores, da densidade e da localização da parte colorida é possível digitalizar o documento de forma a capturar apenas os dados variáveis (campos) do formulário. 18
Inspeção Inspeção A inspeção das imagens pode ser realizada imediatamente após a digitalização; Imagens inclinadas, com dobras ou ilegíveis podem ser digitalizadas novamente em seguida. Podem também ser digitalizados em lotes para inspeção e indexação posteriores; 19
Melhoria de imagens Existem alguns softwares para melhorar a aparência das imagens: supressão de pontos pretos isolados e aleatórios; reforço da imagem, que enfatiza as bordas e os pequenos detalhes da imagem; etc indexação 20
Indexação Para permitir a recuperação de um determinado documento, este precisa ter sido indexado de maneira precisa; A indexação é a chave para a localização dos documentos; Um índice pode apontar para uma pasta que contém um conjunto de documentos sobre um determinado assunto ou sobre um funcionário, por exemplo. Alguns tipos de documentos (atas, artigos, palestras) exigem indexação por assunto, tópico e palavras-chave; Alguns documentos exigem indexação mais complexa, utilizando quase todas as palavras do texto do documento. Por exemplo: depoimento e transcrições legais Indexação Dependendo da natureza dos documentos e seus objetivos, os elementos de informação (metadados) pode ser: título do documento tipo do documento (carta, memorando, ofício) instituição de origem (autora) instituição de destino (alvo) número do documento data de geração do documento data de recebimento do documento palavras-chave 21
Indexação O ato de indexar Realizada a partir da imagem na tela do computador; Identificação do documento com um número; Associar ao documento as informações capazes de permitir a sua recuperação; Indexação Automática Elimina em parte ou totalmente o processo de indexação manual; Alguma (ou todas) as informações que farão parte do índice já estão disponíveis em outro sistema e são importados para o sistema GED. Indexação Precisão do índice Quanto mais informação inserida no índice de um documento, mais facilmente este documento será recuperado; Se nas ordens de compra (OC) você inserir apenas dois elementos, número e data da OC, um erro no número e você perde para sempre o documento; Se dez ou doze elementos são utilizados em uma apólice de seguros, por exemplo, mesmo com um erro no número da apólice ainda será possível localizar o documento pelo nome e/ou endereço do segurado. 22
Indexação Em que momento fazer a indexação? Antes da digitalização A leitura e a indexação do documento é feita em papel; Digitalização posterior Depois da digitalização A qualidade da indexação pode ser verificada através da imagem na tela Armazenamento dos índices Na própria mídia (CD, DVD) Em banco de dados Sistemas (ambiente) GED 23
Sistemas GED: componentes Em um Sistema de GED um documento é digitalizado, transformado em arquivo eletrônico e enviado ao computador para armazenamento; Uma imagem que acaba de ser digitalizada pode ser exibida em um monitor para verificação da legibilidade, inclinação e dobras; Se não for satisfatória, a imagem digitalizada será apagada e o original digitalizado novamente, talvez com resolução mais alta; Se for satisfatória, a imagem é indexada Sistemas GED: componentes Sistemas semi-automáticos Scanner, computador de controle, monitor, unidade de disco e software, tudo em uma única estação 24
Sistemas GED: componentes Sistemas distribuídos Inclui uma jukebox, uma rede local e muitas estações de trabalho 25