text

Ce este OCR sau extragerea textului din imagini și PDF-uri

Cu siguranță, te vei confrunta, mai devreme sau mai târziu cu o situație în care vei dori să convertești un document în format digital, să extragi textul și să-l editezi. Există online o serie de unelte care te pot ajuta să extragi textul dintr-un document printat și să-l editezi. Partea și mai bună este că o parte dintre uneltele de conversie sunt gratuite și dau rezultate foarte bune. Bineînțeles dacă vrei opțiuni avansate, va trebui să apelezi la varianta plătită a acestor servicii.

Atenție, însă, aceste servicii nu vor putea să extragă și formatarea documentului original. Vor extrage doar textul, iar dacă vrei un anume format, va trebui să îl faci manual, odată ce ai obținut textul editabil. Încă ceva, înainte să utilizezi un astfel de tool ar trebui să te asiguri că imaginea este de calitate, respectiv cu o rezoluție de 200 – 400 DPI. În cazul unei imagini cu o rezoluție mai mică, rezultatele nu vor fi la fel de bune.

Nu în ultimul rând, există online o sumedenie de astfel de unelte, dar multe dintre ele nu merg, chiar și cele care se clasează pe primele poziții în rezultatele care apar pe Google la o căutare după „free online OCR”. Am identificat câteva dintre cele mai fiabile unelte de extragere a textului din imagini și din PDF-uri pe care le vom trece în revistă în cele ce urmează. Sperăm să-ți fie de folos!

OnlineOCR
Prima impresie în momentul în care accesezi site-ul este una plăcută. Este un site curat, fără reclame care să-ți distragă atenția de la ceea ce ai de făcut, opțiunile sunt simple și intuitive. Tot ceea ce trebuie să faci este să încarci imaginea, să alegi limba și formatul în care vrei să ai disponibil textul. Poți încărca o poză făcută cu telefonul, atât timp cât este una de calitate. Odată ce ai documentul sursă încărcat, apasă butonul de conversie, iar textul va fi extras și disponibil spre descărcare în formatul selectat inițial.

I2OCR
Procesul de operare a comenzilor este similar cu cel de la OnlineOCR, doar că acest serviciu este puțin mai lent. S-ar putea să ai problema la formatul imaginii, dar dacă în previzualizare totul este în regulă, rezultatul final va fi unul destul de bun. O altă problemă s-ar putea să fie în momentul în care documentul sursă are o formatare mai complicată, cu tabele și coloane. În acest caz, tool-ul ar putea da unele „rateuri”.

Free OCR
Acest tool va converti imaginile în text brut care va putea fi descărcat în format .txt. Nu are o opțiune de conversie în format Word, așa că acest lucru va trebui făcut manual după conversie. Din punctul de vedere al utilizării, unealta are comenzi intuitive, iar viteza de conversie este foarte bună.

ABBYY FineReader
Pentru utilizarea acestui tool va trebui să te înregistrezi, ceea ce îți va oferi o perioadă de test de 15 zile, în care vei putea face conversia la 10 pagini în regim gratuit. După expirarea termenului, va trebui să plătești, dar dacă ai nevoie de câteva conversii pentru câteva pagini, poți folosi cu încredere, deși vei pierde puțin timp cu înregistrarea. Comenzile sunt intuitive, oferă posibilitatea selecției între mai multe formate de documente țintă, precum și o opțiune de traducere automată.

Rezultatele pe care le dau aceste unelte gratuite nu sunt întotdeauna cele mai bune, dar ca soluție rapidă pentru conversia textului unui document fizic în format digital editabil sau extragerea textului dintr-un PDF, uneltele de mai sus pot fi extrem de folositoare. Chiar dacă va fi nevoie de completarea manuală a unor lipsuri, textul va fi extras, în mare.

Leave a Reply

Your email address will not be published. Required fields are marked *