Monthly Archives: Dezembro 2010



Pires, copo e colher, ou como o OCR reconhece os textos

Falando de maneira mais simples, o OCR(reconhecimento ótico de caracteres ) utiliza três tipos de classificação de objetos: de modelo, indicativa e de estrutura.
Por exemplo, tomamos as três coisas: uma xícara, um pires e uma colher. Cada tecnologia descreve cada coisa em seu próprio jeito.

    Modelos- contém cópias de cada item e compara objetos a serem reconhecidos com sua cópia. Se eles são iguais – o objeto é reconhecido. Na classificação indicativa do objeto destacam-se os recursos, e que pertence a uma determinada classe é determinada pela presença de indicações correspondentes. Por exemplo, um círculo de um topo, uma semicircular quando visto de frente e tem um elemento redondo ao lado – um copo. Redonda no topo, mas o lado plano – isso é um pires. Longo e plano quando visto de lado, e com um elemento semicircular no final – uma colher. O sistema estrutural é diferente do indicativo no sentido que o objeto é dividido em elementos e pertencentes a classes definidas por acordo mútuo de elementos: por exemplo, uma xícara – é um objeto composto de um hemisfério com um fundo plano e um elemento semicircular ao lado.

    A ABBYY foi um pouco mais longe. O FineReader para reconhecer os símbolos, usa uma técnica especial, chamada de “percepção holística focada adaptativa”. O princípio da integridade diz que qualquer objeto como um todo é composto de peças ou componentes que são ligados uns com os outros em determinados aspectos. Para classificar um objeto, você deve alocar todos os seus componentes e verificar se você conhece o conjunto através de suas relações.

    O princípio da segmentação significa que primeiramente o sistema dá a hipótese de propriedade do objeto para uma classe, e, em seguida, propositadamente tenta prová-la ou refutá-la. Este princípio não é frequentemente usado em sistemas de reconhecimento, embora nós acreditamos fortemente que ele é o utilizado por organismos vivos na percepção visual do mundo. Na verdade, essa abordagem para o reconhecimento é tão nova que surgiu em nossos sistemas.

    O princípio da adaptabilidade é a capacidade de autoaprendizagem do sistema. Como funcionará o sistema tradicional de OCR com os nossos objetos? Então, o objeto redondo quando você olha de cima, semicircular quando visto de frente, de lado tem um elemento semicircular. Há um objeto dessa classe? Sim, existe, é o copo. Assim, o objeto foi reconhecido.

    Agora imagine que uma parte do objeto está escondida de nós. Suponha que nós não vemos a caneta do copo (que corresponde à má qualidade de reconhecimento de texto). Vemos que o objeto no topo é redondo, visto frontalmente é meio redondo e dos lados não tem nada. Classes com tais características não existem, então isso significa que o objeto não foi reconhecido. Como funciona nosso sistema: primeiro, ele muito rudemente tenta descobrir qual é esse tipo de objeto.

    Então, o objeto é pesado, portanto é o copo ou o pires. De cima o objeto é redondo, de frente é semicircular, o elemento redondo do lado está faltando. O sistema conclui que a probabilidade é, digamos, 80% de esse objeto ser o copo. Em seguida, consideramos outra hipótese, que o objeto é o pires. O topo do objeto é redondo, mas a vista frontal mostra que não é plano, portanto isso não é o pires. Consequentemente, a segunda hipótese é falsa, o objeto foi reconhecido como o copo. Em seguida entra em vigor o princípio da adaptabilidade. O sistema muda as inscrições da classe “copo” e na proxima vez que se encontrar como um “copo errado” vai reconhecer ele já inicialmente.

    Assim, durante o trabalho com os documento o FineReader é capaz de estudar, memorizar defeitos específicos no texto, e, estudando, a velocidade do reconhecimento fica mais rápida. Tendo chegado ao fim do texto, o programa retorna ao topo e passar o texto novamente, conhecendo os novos sinais de classes do objetos.



Concurso De Natal: Todos ganham softwares da ABBYY gratis!

Concurso Natalino da ABBYY
A ABBYY anuncia um concurso de Natal! !
Ganhe os seguintes prêmios:

ABBYY FineReader 10 Ediçao Brasil – 2 kits
ABBYY PDF Transformer 3.0 – 3 kits
•Prêmios com o símbolo corporativo da ABBYY – 3 kits

• + todos os participantes GANHAM o ABBYY Screenshot Reader!

A partir de 1 de dezembro de 2010 até o dia 19 de dezembro, mande foto ou vídeo para o e-mail promotion@abbyy.com referente ao tema “Natal com sabor brasileiro” e concorra ao concurso!

O seu trabalho pode ser sobre as tradições, situações engraçadas, decorações originais ou siplesmente por que é tão querido para você esse feriado… pois a coisa mais importante é a criatividade! :)

Em quais formatos poder ser os seus trabalhos:
•Foto (jpg, tiff – tamanho até 2 Mb)
•Vídeo (avi, mpeg – tamanho até 5 Mb)

Atenção! Os trabalhos não podem conter montagens!

No seu e-mail, por favor, especifique:
1.Nome do seu trabalho
2.Seu nome e sobrenome
3.Sua idade
4.Mais uma vez seu e-mail (só para garantir)
5.Seu endereço

Por favor, leia o artigo “Requisitos Técnicos” na seção “Condições de participação”!

Saiba mais sobre o concurso de Natal no site oficial
Boa sorte! :)