Авторский метод перевода патентных документов

А теперь, собственно, о том, для чего нужна такая возня. D?j? Vu X не работает в самом документе, в отличие от другого популярного инструмента – Trados. D?j? Vu X импортирует документ в свою среду, и пользователь дальше работает с чистым текстом. При этом само форматирование никуда, конечно, не девается, и некоторую его часть можно наблюдать в виде кодов в фигурных скобках. Вот пример фрагмента документа в Word и его же в D?j? Vu X:

Это нужные, «законные» коды, в данном случае – нижний индекс, никуда от визуализации этих кодов не деться. Но есть так называемые «rogue codes», которые самому Word, может, и нужны, но пользователю только мешают. Даже при включенном режиме отображения непечатаемых знаков в Word их не видно. Сюда относятся смарт-теги, теги языка текста, теги отслеживания изменений, пометки проверщика орфографии, изменения масштаба и разрядки символов и прочая ерунда. А приводит это вот к чему:

Первый код не мешает, он в начале предложения, а второй код разбивает нормальное слово на 2, и анализатор текста в дальнейшем не сможет правильно подставить русский перевод из словаря, для него это – два слова «inc» и «ludes» (ну или подставит их перевод, если такие слова существуют в природе и в словаре).

Избавиться от этого мусора, который, кстати говоря, обильно присутствует и после распознавания текста FineReader-ом, призвана вышеприведенная процедура переноса и очистки текста. 100%-го результата она не дает, но количество мусора уменьшается в разы, поверьте – вплоть до нулевого количества.

Для дополнительной очистки документа от ненужных кодов я применяю CodeZapper. Это набор макросов (панель) для MS Word. Один из этих макросов, CZL, убирает коды, которые сочтет возможным. Просто нажимаете кнопку и ждете несколько секунд, в зависимости от замусоренности документа. Перед этим я делаю резервную копию документа-исходника, и прогоняю макрос. Дело в том, что у CodeZapper есть неприятная особенность – он где-то ошибочно правит коды вокруг внедрённых объектов, и D?j? Vu X после этого иногда отказывается импортировать документ. Хотя мы и договорились не вставлять объекты в исходник перед переводом, бывают случаи, когда объектов и нужного форматирования в заявке очень много, поэтому приходится работать с тем, что прислали, без переноса, лишь вычистив что можно. В любом случае рекомендую прогонять CodeZapper на отдельной копии документа, сравнивать статистику по знакам (опять наша бумажка с записями пригодилась!), дабы вдруг он чего лишнего не удалил, и пробовать импортировать исходник в D?j? Vu X. В случае неуспеха возвращаемся к резервной копии и импортируем ее, спотыкаясь потом при переводе об оставшиеся коды (а что делать…).

CodeZapper обладает и другими возможностями для тех переводчиков, которым приходится сохранять все форматирование, но при этом надо как-то переводить. В этом случае CodeZapper умеет выводить рисунки в отдельный файл, потом возвращая их на место, убирать/восстанавливать маркированные списки и прочее. В общем, мощный инструмент. Ах да: где его взять? В последнее время автор CodeZapper-а активно просит помочь проекту в размере 20 евро, после чего высылает программу на почту. Поэтому прямые линки на него потихоньку исчезают, даю ту, которая известна мне (к сожалению, там не последняя версия). А вот страничка автора: http://asap-traduction.com/CodeZapper