Aplicație OCR


(Adrian Roșca) #1

Salut,
Ce aplicații îmi recomandați pentru transformarea unor documente scanate în text?
Mă interesează o aplicație care să proceseze mai multe pagini odată (ex. un pdf cu zeci/sute de pagini)
Nu mă interesează editarea documentului ci mă interesează opțiunile de căutare.
Pdf-urile pe care doresc să le procesez conțin liste alte unor foști angajați, state de plată, etc. O astfel de aplicație mi-ar ajuta foarte mult.


(Cattus Thraex) #2

Eu am folosit și folosesc Readiris Pro v. 12, pt asta am licență, există și versiuni mai noi. Știe româna și alte limbi ale globului. Mi-a scanat și convertit aproape fără eroare peste 100 pagini în cehă, de ex. Există și altele, unele open source, nu știu, posibil să fie suficiente pt tine.


(Lucian) #3

Mai sunt si variante online. Cauta pe gugle cu textul “pdf to text” si ai cateva variante acceptabile. Cel putin mie mi-a mers. Posibil ca dintr-o poza sa nu poata sa scoata text.


(Adrian Roșca) #4

Bună dimineața,
Mulțumesc


(Adrian Ruicanescu) #5

Depinde ce așteptări ai de la rezultat. Am probat Readiris, care într-adevăr mi-a dat foarte puține erori la limba română (pdf din jpeg-uri de pe o carte mai veche, tipar nu foarte curat). Dar Readiris, nu poate în acelaș timp, să reproducă text, imagine și tabel, dacă sunt toate pe aceiași pagină trebuie să alegi. Eu folosesc ABBYY FineReader (tot profesional, deci tot pe bani mulți), dă puțin mai multe erori decât ReadIris, dar poate să reproducă text, imagine și tabel în acelaș timp, de asemenea, poate să desfacă în pagini separate, dacă au fost scanate perechi de pagini în acelaș timp. Eu, cum folosesc carte științifică, am nevoie de text, tabel și imagini în rezultat, deci FineReader este opțiunea mea.


(Cattus Thraex) #6

Deci, să luăm și Readiris și ABBYY! :grinning: