Kako koristiti Tesseract OCR u Javi

Sadržaj

smjerovi

Tesseract knjižnice za optičko prepoznavanje znakova nude programerima način skeniranja dokumenata i teksta u sliku. Koriste se za spremanje slika dokumenata koje više ne trebate na papiru. Možete ih koristiti u Javi stvaranjem kontrolnih petlji za svaki znak i pisanjem u datoteku. Da biste koristili Tesseract knjižnice, morate uključiti Java "imenski prostor" za OCR funkcije.

smjerovi

Tesseract knjižnice omogućuju korisnicima skeniranje njihovih dokumenata (John Foxx / Stockbyte / Getty Images)

Desnom tipkom miša kliknite Java datoteku koju želite koristiti za stvaranje OCR dokumenta. Kliknite "Otvori s" i odaberite Java editor po svom izboru.
Dodajte prostor imena OCR knjižnice na vrh datoteke. Kopirajte i zalijepite sljedeći kod u izvornu datoteku:

com.tplan.robot.imagecomparison.tesseractocr
Stvorite kôd odgovoran za skeniranje znakova za datoteku. Na primjer, sljedeći kod stvara petlje kroz svaki znak u datoteci i zapisuje ih u slikovnu datoteku:

(I = 1; {i} <{linije} +1; i = {i}) je skup vrijednosti koje su definirane kao: +1) {Typeline "{_TOCR_LINE {i}}"}
Kliknite gumb "Spremi" u uređivaču i kliknite "Pokreni" da biste pokrenuli kôd u Java prevodiocu.