Вкл\Выкл свет
Главная » Computing » Системы оптического распознавания текста

Системы оптического распознавания текста

OCR системы. Сравнение и выводы

OCR-системыИнтересная статья об OCR-системах на Хабре. Весьма полный обзор из которого я лично сделал два вывода:

  1. Лучшая система сейчас, безусловно, ABBYY FineReader;
  2. Лучше всего для меня — on-line сервисы оптического распознавания.

Стоит оставить себе ссылку на сервис оптического распознавания текста: www.newocr.com(англ.).

Что умеет:

  • На момент публикации 58 языков. В том числе русский. Некоторые из них могут быть распознаны в «смесях». То есть, смешанный русско-английский текст распознаётся.
  • Форматы:
    • JPEG, JFIF, PNG, GIF, BMP, PBM, PGM, PPM, PCX;
    • Unix compress, bzip2, bzip, gzip;
    • многостраничные документы TIFF, PDF, DjVu;
    • DOC, DOCX, RTF, ODT в которые текст вставлен в виде картинок;
    • архивы ZIP из многих изображений.
  • Поддерживается:
    • Многоколоночный текст;
    • Перевёрнутый текст;
    • Сканы с низким разрешением;
    • Фотографии станиц.
  • Вывод текста:
    • В виде файла;
    • В Google Docs;
    • В Google Translate;
    • В буфер обмена.
  • Не требует регистрации;
  • Не ограничивает количество закачек;
  • Не сохраняет у себя следов работы.


Добавил: prostologin1
Просмотров: 686
/////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////
Всего комментариев: 0
avatar