software para digitalizar texto tipo OCR, qual é o melhor?

 

qual é o melhor software que digitaliza e lê textos que estão em imagem sem muitos erros? o meu tá zoando mt. :((
beijas

 
 

Em geral depende mais da qualidade da imagem, do que do software. Se a imagem está numa resolução mínima de 300dpi então é para funcionar legal.

Pra Linux, uso o KBookOCR.

Para MSwindows, conheço dois: ABBY Finefinder e o Scansoft Textbridge. Tem pra baixar em torrent com crack em qualquer parte (eu uso o torrentz.eu)

 
 

pqp vlw pelo toque vou ver o que faço a respeito :(

 
 

uma dúvida à parte, nada a ver com o assunto: dá pra baixar do torrentz.eu? sempre tentei e parecia bloquear downloads solicitados de fora dos estados unidos.

 
 

o torrentz.eu é um “buscador” de torrent. Ele redireciona para outros site que realmente “hospedam” trackers, como o piratebay ou kickasstorrent. Então tens que fazer a busca no torrentz.eu, escolher o site onde está o .torrent e lá dentro encontrar o link certo.

Tem um bilhão de lugares para clicar que te levam para outra bobagem qualquer. Tem a opção “direct link” que é paga. Tem que ir atrás do “get this torrent” ou “download torrent”, mas que seja direto: não é para ficar navegando por vinte e oito páginas depois de clicar.

Faz um tempo que também tão dando a opção “magnetic link” que é apenas o endereço do tracker do torrent. Aí não precisa baixar nada, pois teu cliente de torrent (bittorrent, utorrent, azureus, etc.) já vai interpretar isso e começar a baixar o programa/filme.

 
 

onde tinha sido falado sobre uma máquina de scanear livros com câmeras?

seria algo assim: www.radicalcontent.org/book-scanner

o.o

podemos montar algo assim bem suss.

 
 

porra eu não sei que resolução q tah essa bagaça. Mas o lance não lê nada. Será que existe alguma maneira? Ou só a transcrição de monge copista medieval poderia solucionar?

 
 

Putz grila, esse link que tu passou é pra fazer em casa? Parece uma nave espacial foto-ciber-ônica de outro mundo! Difícil né?

Mas o lance não é fácil mesmo. Havia encontrado um outro, que é bem parecido:
www.youtube.com/watch?v=a4-qMc2QSOw

Uma coisa importante é manter a câmera fixa e usar foco manual. O foco é o mais chato, pois câmeras simples não têm essa opção.
E sem dúvida vai ter que tratar/mexer na imagem depois (eu sempre faço isso, mesmo com scanner normal).

Esse me inspirou de fazer algo na linha. Mas, ainda tô preparando um manualzinho do troço que fiz. Logo mais, adiciono aqui.

 
 

meninas, eu não sei qual seria o melhor software, mas escrevam para diabolo@listas.sarava.org perguntando e alguém lá responde pra vcs :) (é um coletivo técnico anti-capitalista que atua aqui em sp)

 
 

vlw

 
 

Encontrei um projeto do gugou que se chama code.google, onde tem uma montanha de códigos abertos, CC ou GPL, livres para baixar e compilar. É tipo o sourceforge.net

Lá, tem o código do software mais usado para reconhecimento de caracteres (OCR) usado em Linux (era da HP, mas agora tá aberto), o Tesseract-ocr. Dá para baixar dos repositórios do ubuntu/debian, mas ali tem os pacotes de línguas e alguns aplicativos com interface gráfica (GUI).

Ainda estou testando. Se encontrar algo que funcione legal, eu aviso!

 
 

me parece confuso, mas verei.

 
 

O Tesseract-ocr é um software para reconhecimento de caracteres (OCR). Tem versão para windous e Linux aqui: code.google.com/p/tesseract-ocr/downloa...; assim como pacotes de línguas (para português: tesseract-ocr.googlecode.com/files/por.... ).

Segundo me parece, a versão para Linux é via linha de comando (windous não sei). Então, fizeram várias interfaces para usuário para facilitar o trampo. Eu testei algumas e gostei dessa: sourceforge.net/projects/gimagereader

Coloquei o pacote .deb (para Linux baseado em debian) ao lado. Então, instala o tesseract primeiro (vai no terminal, descompacta, ./configure, resolve as dependências, make, sudo make install) e o gimagereader com suporte on-line em seguida (só clicar duas vezes no ubuntu). Aí, de dentro do programa dá para ativar uma língua qualquer (ele baixa sozinho).

Mas lembra: as imagens (foto ou scan) DEVEM ESTAR EM BOA QUALIDADE! (300DPI).
Senão, não tem jeito.

 
   

outra maneira de instalar o gImageReader: linuxg.net/how-to-install-gimagereader-2-93-on-ubuntu-linux-mint-elementary-os-and-pinguy-os