Linux, распознавание текста, сканирование документов

Posted by tayfur  •  Теги Ubuntu Fedora Arch

И так. В Linux, как и положено, всё состоит отдельно из консольной программы и отдельно из GUI оболочки.
Собственно сами программы для распознавания текста:

  • tesseract - бесплатная программа для распознавания текстов. Используется Google для распознавания в Google Docs, поддерживает множества языков.
  • cuneiform - разработка российской компании Cognitive Technologies.

Далее GUI оболочки:

  • yagf - на QT, выглядит не особо. Работает с cuneiform и tesseract.
  • ocrfeeder - на GTK. Работает с cuneiform и tesseract.
  • gimagereader - имеет реализацию и на GTK, и на QT. Работает с tesseract.

И так. Я использую tesseract и gimagereader.
Ставим tesseract и языковые пакеты для него (пример для Arch):

pacman -S tesseract tesseract-data-eng tesseract-data-rus

Для tesseract есть множество языковых пакетов включая японский, корейский, китайский традиционный/упрощённый.
Далее ставим gimagereader и орфографические пакеты:

pacman -S gimagereader-gtk hunspell-en_US

Также есть вариант gimagereader-qt для QT.
Для gimagereader можно поставить дополнительные орфографические пакеты.
Для русского языка в Arch пакет находится в AUR: hunspell-ru.
Далее в меню у нас появляется ярлык gImageReader. Запускаем и пользуемся.

Комментарии (0)  •  вс, 01/06/2019 - 21:04