Sistem za prepoznavanje štampanog teksta korišćenjem Tesseract biblioteke

  • Mikloš Popović Fakultet tehničkih nauka, Univerzitet u Novom Sadu
Ključne reči: Prepoznavanje štampanog teksta, Tesseract, kamera, Python, mašinska vizija

Apstrakt

U radu je predstavljeno jedno rešenje sistema koji omogućava prepoznavanje štampanog teksta na slici upotrebom digitalne obrade slike, tj. mašinske vizije. Cilj je bio napraviti aplikaciju pisanjem programskog koda u Python-u uz upotrebu Tesseract biblioteke koja omogućava prepoznavanje štampanog teksta, nakon čega se formira fajl u kome se nalazi prepoznati tekst. Analizirana je osetljivost predloženog rešenja na način akvizicije pomoću kamere, tj. veličinu slova, kao i koje tehnike obrade najbolje utiču na željeni rezultat.

Reference

[1] Chen, X., Jin, L., Zhu, Y., Luo, C., & Wang, T. (2021). Text recognition in the wild: A survey. ACM Computing Surveys (CSUR), 54(2), 1-35.
[2] Gonzalez, R. C., & Woods, R. E. (2018). Digital Image Processing, Hoboken.
[3] Sonka, M., Hlavac, V., & Boyle, R. (2014). Image processing, analysis, and machine vision. Cengage Learning.
[4] Smith, R. (2007) An overview of the Tesseract OCR engine. ICDAR 2007, Vol. 2, pp. 629-633. IEEE.
Objavljeno
2022-10-05