Vítejte, Host
Uživatelské jméno Heslo: Pamatovat si mne

Téma: Kvalitní opensource OCR s podporou češtiny.

Kvalitní opensource OCR s podporou češtiny. 6 roků 9 měsíců zpět #4


  • Příspěvky:45 Obdržená poděkování 5
  • Avatar uživatele Michal
  • Michal
  • Administrátor
  • OFFLINE
  • Karma: 5
Máte někdo praktické zkušenosti s nějakým OCR nástrojem, který umí češtinu a je opensource? Ideálně pro příkazovou řádku.
Poslední úprava: 6 roků 9 měsíců zpět od Michal.
Administrátor zakázal veřejné příspěvky.

Re: Kvalitní opensource OCR s podporou češtiny. 6 roků 8 měsíců zpět #7


  • Příspěvky:9 Obdržená poděkování 2
  • Avatar uživatele xmorave2
  • xmorave2
  • Administrátor
  • OFFLINE
  • Karma: 3
Zatím nemám vyzkoušeno, ale chystám se to otestovat: tesseract-ocr


https://code.google.com/p/tesseract-ocr/

Multiplatformní opensource pod Apache licencí, vypadá to na stabilní a dostatečně robustní kousek software.

Umí zpracovávat asi 40 jazyků včetně češtiny.

Standardně se s ním pracuje právě z příkazové řádky.
Administrátor zakázal veřejné příspěvky.

Kvalitní opensource OCR s podporou češtiny. 5 roků 10 měsíců zpět #68


  • Příspěvky:1
  • Avatar uživatele vojtisev
  • vojtisev
  • Začátečník
  • OFFLINE
  • Karma: 0
K2PDF umožňuje výběr mezi GOCR a Tesseract, je to primárně nástroj na převedení pdf do čitelnějšího formátu na zařízení s menším displejem, ale vyhodí to i txt. Nastavení lze modifikovat přes příkazovou řádku, nebo GUI ve win.
Administrátor zakázal veřejné příspěvky.

Projekt vznikl za podpory
Kabinet Informacnich studii a knihovnictvi, MU Brno    Mestska knihovna Ceska Trebova    Mestska knihovna Usti nad Orlici