Kako koristiti Tesseract OCR u Javi

Autor: Judy Howell
Datum Stvaranja: 6 Srpanj 2021
Datum Ažuriranja: 1 Svibanj 2024
Anonim
Kako koristiti Tesseract OCR u Javi - Članci
Kako koristiti Tesseract OCR u Javi - Članci

Sadržaj

Tesseract knjižnice za optičko prepoznavanje znakova nude programerima način skeniranja dokumenata i teksta u sliku. Koriste se za spremanje slika dokumenata koje više ne trebate na papiru. Možete ih koristiti u Javi stvaranjem kontrolnih petlji za svaki znak i pisanjem u datoteku. Da biste koristili Tesseract knjižnice, morate uključiti Java "imenski prostor" za OCR funkcije.


smjerovi

Tesseract knjižnice omogućuju korisnicima skeniranje njihovih dokumenata (John Foxx / Stockbyte / Getty Images)
  1. Desnom tipkom miša kliknite Java datoteku koju želite koristiti za stvaranje OCR dokumenta. Kliknite "Otvori s" i odaberite Java editor po svom izboru.

  2. Dodajte prostor imena OCR knjižnice na vrh datoteke. Kopirajte i zalijepite sljedeći kod u izvornu datoteku:

    com.tplan.robot.imagecomparison.tesseractocr

  3. Stvorite kôd odgovoran za skeniranje znakova za datoteku. Na primjer, sljedeći kod stvara petlje kroz svaki znak u datoteci i zapisuje ih u slikovnu datoteku:

    (I = 1; {i} <{linije} +1; i = {i}) je skup vrijednosti koje su definirane kao: +1) {Typeline "{_TOCR_LINE {i}}"}

  4. Kliknite gumb "Spremi" u uređivaču i kliknite "Pokreni" da biste pokrenuli kôd u Java prevodiocu.