logo
Болгарчук Р

Программы в общем.

После того, как у вас появилась цифровая версия книги, перейдем к следующему пункту раздела «Алгоритм действий.», а именно переводу книги в нужный формат.

Наверно, повторюсь, трудно писать о том, что происходит в данном направлении сейчас, т.к. информационные технологии настолько быстро развиваются, что успеть за ними и уследить, практический невозможно. Поэтому то, что сейчас только внедрили, уже завтра может быть безнадежно устаревшим. Тем не менее, некоторые технологии вчерашнего дня, по ряду причин, до сих пор все еще актуальны. Например, все не как не соберу денег на новый смартфон, да и старый меня вполне устраивает, поэтому я, как и 5 лет назад, продолжаю слушать книги на своем стареньком N-82. Хотя, уже давно пора перейти на железо под управлением андроида, или чего-то подобного. Но по ряду причин все еще не перехожу. Дорого, да и подходящих мне смартфонов, по-видимому, пока не придумали.

Конвертация книг частично рассмотрена в подразделе: «Сохранить книгу в нужном формате», ниже. К тому же тема довольно большая, т.к. форматов много. Если говорить за фанридер. То, в нем есть кнопка «Файл», «Сохранить документ как…» и выбираем нужный формат.

Рис. 33 Настройки в программе файнридер.

Рекомендую сохранять в двух форматах .docx и .pdf (текст под изображением). Не буду долго расписывать почему, зачем, как... Нюансы распознавания. Хотя наверно стоило бы. Но это долго. Если кому надо, Googlите, есть на YouTube не плохие видео «Как распознавать книги файнридером». Или, надеюсь, в будущем появится бесплатная аналогичная программа.

Если имеется уже распознанный текст, возможно, потребуется его переконвертировать в нужный формат. В зависимости от формата, можно воспользоваться стандартными средствами. Т.е. программами, работающими именно с этим форматом, либо задействовать какие-то специализированные «всеядные»: конвертеры форматов. Например, многие не ухищрённые пользователи думают, что все, что сохранено в .pdf является картинкой. Но на самом деле в данном формате может быть, как картинки, так и текст. Зачастую этот текст оттуда быстрее «вытянуть», чем распознавать фанридером. Делается это акробатом, но, к сожалению, только платной версией: Acrobat Pro. Среди именно конвертеров с pdf файлами работают AVS Document Converter, или разные PDF2Word. Аналогично можно преобразовывать с помощью специальных конверторов файлы формата .chm, .fb2, .epub и другие.

П. с.

Кому интересно узнать больше о самих принципах распознания текстов, в качестве дополнения, могу порекомендовать навскидку пару интересных статей: «Распознать нельзя оставить картинкой, или кое-что о сложных случаях оптического распознавания текста». В ней доступным языком повествуется о простых для человека, но в то же время чрезвычайно сложных проблемах для программы распознания текстов. И подробная статейка о разницы векторных и растровых шрифтов «Векторный и растровый текст». Хотя вторая статья не относится непосредственно к теме распознания, но все же, возможно станет подкреплением и дополнением к подразделу «Код буквы и картинки – книга глазами ЭВМ.»