Главная Программы Как распознать текст
Как распознать текст
Хороший блог - Программы
20.10.2010 11:59

Итак начнём обучение по распознаванию текста. Для начала вам понадобится программа по распознаванию текста, например FineReader. Лично я пользуюсь именно этой программой и она меня полностью устраивает. Так же нужен сканированный материал в формате понятным для программы по распознаванию текста. Сейчас это такие форматы как: bmp, dcx, ipg, ipeg, jfif, jp2, j2c, pcx, png, tif, tiff, pdf.

Можно так же сканировать прямо из программы FineReader, это самый удобный вариант работы, но для этого нужен бумажный носитель. Итак приступим непосредственно к распознаванию. Откройте программу FineReader и загрузите любым способом (сканированный или откройте) исходный материал.

finereader

Нажмите кнопочку "распознать" и через пару секунд в правом окне будет ваш текст полностью распознанный. Всё довольно просто.

finereader

Далее можно проверить нажав на соответствующую кнопку. Пройдя по всем словам, по которым у программы возникли сомнения по правильности распознания, можно откорректировать полученный текст.

finereader

Далее можно передать сканированный материал в другую программу, например Word или скопировать в буфер обмена, для дальнейшего использования.

finereader

Иногда весь текст не нужен или вы желаете переносить в другую программу текст частями, для вставки каждой части в нужное место. В этом случае можно выделить только необходимый кусок текста и скопировать его в буфер обмена, а затем вставить из буфера в нужном месте.

finereader

Например можно вставить полученный материал из буфера обмена в программу блокнот.

finereader

Конечно самое удобное это вставить в Word, при этом сохраняется вся форматизация текста. И текст после вставки в Word выглядеть так:

finereader

Далее с полученным текстом можно делать всё что угодно. Его можно редактировать, изменять, распечатать и т.п. Одним словом использовать по своему усмотрению. Как видите ничего сложного. А ещё программа FineReader может распознавать сразу много страниц. Для этого выделите все страницы предназначенные для распознавания и перетащите все вместе в программу. Далее выделите все странички в правой колонке и нажмите распознать. В зависимости от мощности вашего компьютера, через некоторое время все странички распознаются. Так же выделив все странички после распознавания их можно все вместе скинуть в Word.

Таким образом, при большом количестве страничек работает в основном программа, человеку придётся лишь потом слегка проверить полученный результат. И вот представьте себе, что за такую работу платят неплохие деньги, примерно 0,1$ за 1000 символов. Используемая для примера статья имеет 1880 символов и стоимость работы по распознаванию примерно 5,60 рубля. При заказе, например 100 страниц, можно заработать от 500 рублей всего за 2-3 часа работы, причём основное время будет работать программа и ваш компьютер.

 


© 2010-2013 GutenBlog.ru