Tecnologia de OCR

August 27, 2008

Longe de ser novidade no mercado de TI, as tecnologias de captura de dados ICR (Inteligent Character Recognition) e OCR (Optical Character Recognition) finalmente chegaram a um estágio de maturidade e excelente relação custo benefício. Este mercado, com suas necessidades e tendências, cada vez mais voltadas ao uso de GED (Gerenciamento Eletrônico de Documentos), Content Management e eliminação/redução na utilização de documentos em papel e captura de dados com rapidez, eficiência, confiabilidade, além de custos atraentes, passou a ser um requerimento bastante popular e constante em grande número de RFP´s no Brasil e no mundo. Optical Character Recognition, normalmente abreviado como OCR, é a tradução mecânica ou eletrônica de imagens de textos manuscritos ou impressos (usualmente capturados por um scanner) em texto eletrônico editável.

Outras nomenclaturas são utilizadas para variações desta tecnologia. Alguns exemplos são: ICR (Intelligent Character Recognition) que se aplica normalmente a reconhecimento de caracteres manuscritos. OMR (Optical Mark Recogntion) para reconhecimento de marcas tipicamente usadas em formulários com múltiplas opções de escolha. Documentos e Aplicações Podemos classificar as aplicações de captura de documentos sob três grandes categorias no que se refere à tecnologia de OCR. Esta classificação está diretamente conectada aos tipos de documentos candidatos à captura de seus dados ou conteúdo de forma manual ou automática, ou seja, com o uso de OCR. Documento Estruturado É o tipo de documento mais comumente chamado de formulário.

Para um documento ser considerado estruturado, seu formato deve ser fixo, incluindo seus campos e a localização de toda informação a ser capturada. Exemplos típicos deste tipo de documento são: formulários de imposto de renda, formulários de coleta de dados para o censo, formulários de aplicação para abertura de conta corrente e cadastramentos em geral, boletos de pagamento, DARFs, GAREs e etc. Mesmo que não sejam formulários típicos, se o documento tiver um padrão constante que possibilite a localização dos campos a serem capturados, ele pode ser considerado estruturado. Em outras palavras, nas aplicações consideradas estruturadas, sabemos que dados devemos capturar e onde estão localizados estes dados em cada documento.

Documento Semi-estruturado É o tipo de documento que contém campos conhecidos porém dispostos de maneira completamente variável de documento para documento, tipicamente pela diversificação de origem dos mesmos. Exemplos clássicos destes documentos são notas fiscais e relatórios de formato variável. Mais recentemente difundidas no mercado, as aplicações de captura de dados em documentos semi-estruturados chegaram para facilitar, reduzir custos e agilizar as aplicações de Contas a Pagar e Receber, integradas ou não aos sistemas ERP das empresas. Simplificando, a exemplo do que fizemos para as aplicações consideradas estruturadas, as semi estruturadas são aquelas em que sabemos o que devemos capturar, porém não sabemos onde estão localizados estes dados em cada documento. Neste caso, a solução é acrescentar uma etapa ao processo, onde todo o documento é “lido” (full text OCR) e, por intermédio de scripts, algoritmos sofisticados, palavras chave, topografia, mecanismos de aprendizado e etc, primeiramente localizamos os dados candidatos à captura para depois reconhecê-los campo a campo.

Documento não-estruturado São todos os tipos de documento que não se encaixam nas definições acima. São várias aplicações candidatas a uso de OCR para este tipo de documento. As mais popularizadas e utilizadas no mundo são as de “Classificação de Documentos”. Documentos não-estruturados podem ser processos administrativos, emails, correspondência ou qualquer informação que necessite ser capturada ou armazenada baseada em seu conteúdo e forma. Aplicações também chamadas de “full-text OCR” são tipicamente associadas a documentos não estruturados. Jornais, revistas, Diários Oficiais, pastas de RH e etc, serão “lidos” pelos motores de OCR e seu conteúdo será capturado e/ou classificado de acordo com a definição e necessidade da aplicação.

Tendências e Plataforma única Uma das tendências importantes que o mercado já reconhece e que a evolução da tecnologia já permite é a “mistura” de documentos de diversos tipos e formas dentro da mesma aplicação. Desta forma, a necessidade de preparação, separação ou classificação dos documentos de forma manual é eliminada. Portanto, um requisito bastante importante quando analisando uma solução de OCR para as necessidades de sua empresa é o conceito de Plataforma Única. Ou seja, a mesma solução tecnológica resolvendo seus problemas de captura em documentos estruturados, semi-estruturados e não-estruturados.

Fonte: Document Management

Caso tenha interesse em conversar com nossos especialistas em Document Imaging clique AQUI, ou acesse nosso portal www.datasul.com.br/franquias/ecm


Trabalhando processos de negócio

August 20, 2008

Tudo que nós produzimos, tanto em nossas organizações quanto na vida pessoal, nós o fazemos por meio de processos. Se nossa organização produz sorvetes, ela o faz por meio de diversos processos. Produz televisores? Idem. Aparelhos de DVD, celulares, tudo que produzimos nós o fazemos executando uma série de processos.

Na nossa vida pessoal também executamos processos para fazermos tudo que queremos ou necessitamos fazer. Embora ninguém vá querer documentá-los e gerenciá-los como fazemos nas organizações. Precisamos entender de processos a partir das suas características essenciais. Por isso vamos começar pela classificação aceita universalmente dos mesmos.

Tipos de processos de negócio: primário e secundário. Natureza dos processos de negócio: industriais de manufatura discreta e contínua (de transformação) e de serviços. Estes processos são invariavelmente processos primários. Já os secundários são processos ligados ao apoio de todos os processos, inclusive dos próprios. Entretanto, qualquer que seja o tipo e a natureza dos processos de negócio, todos eles têm vários elementos em comum e um dos mais importantes é justamente a documentação. As documentações mais importantes encontradas em todos os processos são a estratégica, a operacional e a técnica.

Existem outras, mas não vou explicitá-las agora. Na documentação estratégica estão: o plano estratégico e seus objetivos; as políticas e normas que orientam o modo de fazer negócio da organização e servem de base para os processos de negócio. Sem dúvida, que o plano estratégico não é exclusividade dos processos de negócio, mas eles servem para embasar a criação de todos eles, pois todos os processos têm que estar direta ou indiretamente ligados ao planejamento estratégico da organização.

Na documentação operacional estão os manuais dos processos de negócio da organização, tantos os dos processos primários quanto os dos processos secundários. São estes manuais que descrevem os elementos dos processos de negócio e é com eles que podemos produzir bens e serviços com qualidade, eficiência e eficácia. Na documentação técnica estão todos os manuais de equipamentos, máquinas e quaisquer outros dispositivos usados pelos processos de negócio. Por esta breve introdução sobre os tipos de documentação existentes (ou que deveriam existir) nos processos de negócio você pode concluir como a gestão documental é importante. Infelizmente, esta documentação na maioria das organizações não existe ou na melhor das hipóteses existe pela metade, fazendo com que os processos de negócio produzam bens e serviços sem qualidade nem no processo em si e nem no produto.

Além do que, a falta desta documentação impede que os processos sejam formalmente conhecidos e com isto possam ser continuamente melhorados, pois se não sabemos “como estamos produzindo” fica impossível sabermos “o que e como podemos melhorar.” Para evoluirmos nesta discussão tomemos em conta uma questão básica sobre processos de negócio: a definição do produto. A questão é: sair fazendo ou projetar antes de fazer? Por exemplo, procure saber onde está o documento que “projetou” cada produto que sua organização produz. Eles existem? Ah! Você não sabe responder? Então é provável que eles não existam. Bom, se os documentos dos “projetos dos produtos” não existem a pergunta seguinte é: como base em quais dados, informações, conhecimentos os processos de negócio que produzem tais produtos foram criados? Em resumo, se sua organização não tem documentos dos “projetos dos produtos” conseqüentemente os processos que os produzem são completamente informais e como conseqüência disto todo mundo faz o melhor que pode sem nenhuma garantia de que estão fazendo “a coisa certa” e muito menos com qualidade, tanto no processo quanto no produto.

Desta forma fica impossível melhorarmos o que estamos fazendo porque estaremos invariavelmente atacando os efeitos e não as causas dos problemas. O projeto do produto é tão importante que algumas normas, como a NBR ISO 10007:2005 dispõe sobre as Diretrizes para a Gestão de Configuração. A norma 10007, que trata da gestão de configuração é diferente das outras normas porque está na raiz do produto que será produzido. Quer seja serviço quer seja bem, o propósito da 10007 é o de especificar como cada um dos produtos deve ser configurado, quem pode configurá-los, como são feitas as modificações e/ou atualizações nos produtos e como manter a rastreabilidade de tais intervenções. Pense nisso quando olhar para dentro da sua própria organização.

Geralmente as pessoas pensam apenas nos arquivos ativos e inativos (não repita que existem arquivos mortos, os profissionais ligados à ciência da informação não gostam deste termo!) quando se referem à gestão documental. Até mesmo a maioria dos profissionais ligados à área de gerenciamento eletrônico de documentos (GED) se preocupa muito mais (quando não somente) com a documentação técnica do que com a estratégica ou a operacional, o que até certo ponto é compreensível, pois documentar, organizar e guardar informações sobre processos de negócio é tarefa que a maioria desconhece, pelo menos com o grau de detalhamento que este universo exige.

Por: Document Magement


O Content Management pode impulsionar os negócios?

August 20, 2008

Implantar um content manager como o Datasul By You ECM é com certeza uma decisão muito importante para qualquer organização que considera a comunicação e a colaboração uma estratégia de excelência operacional no seu negócio. Assim como qualquer investimento a implantação de um content manager deve trazer o devido retorno, mas às vezes ficamos com dúvidas de como mensurar seus ganhos. Então por que implantar um content manager? Quais os benefícios que isso trará para o meu negócio?

Estas perguntas são fáceis responder já que é muito ampla a gama de soluções suportadas.

Para ajudar a refletir relacionamos algumas boas idéias para garantir o retorno de investimento:

  • Criação de canais de comunicação com parceiros de negócio e ou distribuidores para disponibilização de documentação técnica, material promocional, campanhas de marketing e endomarketing, acesso a transações de negócio personalizadas como consultas de estoques, colocação de pedidos, cadastramento de clientes entre outros.
  • Áreas de acesso restrito a clientes para disponibilização de informações sobre seus pedidos, entregas, índices de atendimento, assistência técnica ou até mesmo simulações e orçamentos.
  • Painéis de gestão com índices e indicadores de desempenho da organização como suporte a decisão dos executivos.
  • Fomento a programas de qualidade com áreas exclusivas para participação e contribuição de colaboradores.
  • Canais personalizados de acesso a processos estruturados e Workflow/BPM.
  • Programas de treinamento on-line e TVs corporativas;
  • Comunidades on-line patrocinadas, com blogs, fóruns e podCasts (Web 2.00).

Pensando nestas e em muitas outras aplicações facilmente conseguimos mensurar o retorno da implementação de uma estratégia de Content Management:

  • Redução do custo de oportunidade;
  • Aumento de produtividade impactando diretamente nos custos operacionais;
  • Melhoria da comunicação interna e externa através de um canal centralizado;
  • Otimização nível de atendimento através do aumento da oferta de serviços on-line;
  • Integração entre os colaboradores, mesmo os que estão geograficamente distribuídos;
  • Melhoria da imagem geral da organização pelo investimento em melhoria do atendimento e inovação tecnológica;
  • Manutenção e formação de amplas bases de conhecimento sobre clientes, processos, enfim sobre toda a cadeia de negócio;

Por Carlos Pereira