logo search
Лекції

17.3. Редактор і автоматизована система оптичного розпізнавання тексту та його переклад з іншої мови.

Нерідко видавці звертаються до видань попередніх років з метою їх передруку. Раніше іншого виходу як набрати заново текст (за винятком репринтних видань) не було. Однак цей шлях був і тривалим у часі, і витратним у коштах. Але комп'ютерна техніка й тут стала для видавців знахідкою. Невеликий за розміром пристрій — сканер — зі спеціальною програмою дає змогу швидко та якісно ввести зображення сторінок у пам'ять комп'ютера (сканування документа), опрацювати це зображення, розпізнати його знаки і зберегти для подальшої роботи редактора.

У Європі найвідоміші дві програми оптичного розпізнавання графічних символів — FineReader і CuneiForm. В Україні видавці більше користуються FineReader. Ця програма здатна розрізняти тексти більш ніж на 40 мовах світу, легко справляється з текстами, набраними в одну чи кілька колонок, не боїться оригіналів блідих, на темному папері, набраних нестандартними шрифтами.

За допомогою FineReader сканований текст редагується і також експортується у Microsoft Word чи Excel для подальшої редакторської роботи.

Звичайно ж, як і будь-яка програма, FineReader не є ідеальною, тому здатна допускати помилки. Завдання редактора полягає лише в тому, за яких обставин і в яких текстах їх можна очікувати більше.

Ймовірність помилок, як засвідчує практика, буде більшою за таких обставин:

1. Якщо текст сканувався з оригіналу гіршої якості (бліді, або, навпаки, затемнені сторінки).

  1. Якщо в гарнітурі шрифтів є надто тонкі засічки, особливо в літерах е, є, и, н, п (цим грішить, зокрема, готичний шрифт; при неякісному друці ледь помітні засічки спонукають програму пропонувати перше-ліпше схоже слово із словникового запасу).

  2. Якщо сканується текст з іншою правописною системою (скажімо, видання української діаспори або українські видання 20-х років XX століття, в основі яких була репресована радянським режимом правописна система міністра освіти М. Скрипника).

  3. Якщо це видання художньої літератури (переважна більшість майстрів красного письменства має власні особливості мови, стилю і навіть синтаксису, що нерідко іде врозрізіз закладеними у програму правописними нормами).

  4. Якщо це офіційні видання (допущені в таких виданнях кальки, мовні покручі не виправляються, а мусять повторитися при перевиданні).

  5. Якщо в тексті багато цитат (їх, зрозуміло, належить відтворювати не за правилами граматики, а так, як вони звучали в первинному виданні).

Проаналізуємо випадки появи таких помилок під час дії вмонтованої системи коригування орфографії Lingvo Corrector.

Найчастіше після сканування програма FineReader плутає подібні за начерком літери: с — о; п — н; н — и; е — є; ж — ч; е — о. Зміна однієї літери, таким чином, змінює зміст фрази. Поданий нижче перелік досить дивних фраз, виловлених редактором реального видання на останньому етапі звірки оригінал-макета може зорієнтувати редактора-початківця в тому, як непомітно закрадаються в текст помилки із сканованого тексту (виділене напівжирним шрифтом слово у тексті неправильне, у дужках подається правильний варіант, яким програма чомусь зігнорувала):

Не міг стерпіти такої напруги (наруги);

Він хотів досягнути повних цілей (певних);

Варто переробити пункт 5 революції (резолюції);

Ціна новому саду така, що держава не протримається й місяця (ладу);

Сусід на пиво був веселий (на диво);

Серед темної ночі, на баяні (багні);

З кріпким олівцем на губах (слівцем);

Нарада очолила насущні проблеми (оголила);

Роз'єднаність стоїть на перешкоді козацькій оправі (справі);

Між нами немає ніяких річниць (різниць).

У наведених вище прикладах помилки робилися в результаті зміни однієї літери. Однак редактору слід пам'ятати, що програма, розпізнаючи слово, сама замінює дві літери в слові:

Великі по(лі)тики Тарновські (поміщики);

Сів біля ніг кобзаря і (оп)ухае (слухає).

І ще один сектор можливих помилок, який потребуватиме посиленої редакторської уваги — цифровий ряд. При скануванні він також може зазнавати певних змін. Такі помилки є особливо прикрими в історичних і недопустимими в навчальних виданнях. Природа їх появи така ж, як і в буквеному ряді: схожість графічного зображення, неякісний відбиток. Саме через це, скажімо, цифра 8 може перетворитися на 3, а 6 — на 5. Так, в одному з книжкових перевидань надруковано, що російська війна з Наполеоном сталася не 1812, а 1318 року.

Помилка через нерозпізнання програмою знака між цифрами вийшла і в такому реченні: "Він уклінно просив його прийняти всього лиш на 23 хвилини" (замість 2-3 хвилини).

Коротко про особливості роботи редактора з комп'ютерними програми перекладу з однієї мови на іншу. В одних випадках вони полегшують роботу професійного перекладача, в інших — ускладнюють. Але загальний висновок може бути однозначним: передовірятися цим програмам ніяк не можна. Машина поки що не навчилася розпізнавати перекладене слово у контексті його змістового зв'язку з іншими словами, не враховує вона й багатої омонімії, синонімії, властивих для кожної мови. Ось чому в перекладах часто усталене словосполучення подається в неприпустимому варіанті. Подамо кілька прикладів перекладу таких словосполучень, скажімо, з російської на українську мову, здійсненого за допомогою комп'ютерної програми перекладу:

Текст російською мовою Українськомовний автоматизований переклад

Министерство образования Украины Міністерство утворення України

Сочинения Вальтера Скотта Твори Вальтера Скотини

Более половины новорожденных мужского пола Понад половина новонароджених — чоловіча підлога

Каждая глава в книге начинается из шмуцтитула Кожний керівник книги починається зі шмуцтитулу

Несподіваних сюрпризів від комп'ютерних програм можна чекати й на прикінцевому етапі підготовки оригі-нал-макета — виведення плівок. Нижче подаємо фрагменти одного й того ж тексту: а) на етапі чистовика перед виведенням плівки; б) після виведення плівок. Збій комп'ютерної програми, який стався, ймовірно, через зміну електричного струму в мережі, призвів до того, що текст усієї сторінки злився в єдине ціле, без проміжків між словами.

а) б)

Как же быть? Как стать человеком, о котором можно сказать - он ценит время, он знает, чего стоит день? Как научиться удержать в руках быстротекущие мгновенья, не торопиться чересчур - но и не откладывать легкомысленно дела, быть тщательным в подсчетах времени, знать причины его потерь и устранять их? На многие из этих вопросов мы попытаемся дать ответ в этой книге.

Какжебыть?Какстатьчеловеком,окоторомможносказать-онценитвремя,онзнает,чегостоитдень?Какнаучитьсяудержатьврукахбыстротекущиемгновенья,неторопитьсячересчур-ноинеоткладыватьлегкомысленнодела,бытьтщательнымвподсчетахвремени,знатьпричиныегопотерьиустранятьих?Намногиеизэтихвопросовмыпопытаемсядатьответвэтойкниге.

Насичений конкретними прикладами з практики сучасного книговидання матеріал цієї теми дає можливість зробити такі висновки:

  1. Технічний прогрес значно спростив і удосконалив техніку роботи редактора з оригіналом майбутнього видання.

  2. Якими просунутими й осучасненими не були б комп'ютерні програми, замінити людський фактор, іншими словами, досвідчене око, розум і творчий підхід до справи редактора, коректора вони поки що не зможуть. Це ще раз доводить, що спроби будь-яким способом формалізувати творчість, загнати її в машинні рамки програм-роботів поки що нікому не вдавалися.

  3. Залежно від видів видань редактору важливо знати типові помилки, яких допускають автоматизовані програми перевірки правопису чи оптичного розпізнавання текстів, зметою виявлення їх і виправлення в ручному режимі.

Тема № 18