Двухэтапная обработка текста при переводе

Как известно, технические тексты содержат довольно большое количество повторяющихся слов и словосочетаний, которые могут иметь либо терминологический, либо общелексический характер. Обычно авторы не стремятся придать своим творениям высокохудожественную форму, поэтому мало заботятся о разнообразии, что, естественно, нам только наруку. В отличие от литературных переводчиков, мы не обязаны делать «из говна конфетку», а в отношении патентов это просто нежелательно. Поэтому нам нужно переводить эти повторяющиеся формы единообразно. Но как это осуществить, когда таких форм в тексте видимо-невидимо, а сам текст имеет объем больше сотни страниц? Выписывать на бумажке образцы перевода? Нет, нет, и еще раз нет! Воспользуемся современными технологиями.

1. Выявление повторяющихся конструкций

Это основной этап обработки текста, подлежащего переводу. Можно, конечно, пытаться находить повторяющиеся словосочетания вручную, по мере перевода, и пользоваться инструментом поиска и замены. Однако такой подход не дает существенного ускорения и, кроме того, в глаза бросаются, в первую очередь, всяческие терминологические конструкции, тогда как зачастую встречаются самые обычные конструкции, не связанные с терминологией, но в большом количестве. Как узнать, что их много в тексте? Всё не проверишь! Поэтому нужно использовать специальный программы анализа текста. На сегодняшний день мне известны две программы, заслуживающие внимания, а именно, Concordance и TextAnalyst.

Что касается TextAnalyst, программа весьма мощная, но ее нужно долго осваивать, есть даже учебник по ней, и я ее в настоящее время не использую. Мне больше нравится Concordance. Краткое руководство по ее использованию я изложил отдельно.
К сожалению, эта программа не создана специально для переводчиков и поэтому не вполне отвечает всем требованиям, но все же с ее помощью можно довольно успешно обрабатывать не очень сложные тексты произвольного размера. Трудность ее использования заключается в том, что приходится думать, в какой последовательности заменять словосочетания их переводами. Если мы нашли, скажем, словосочетание из двух слов, нужно посмотреть, нет ли повторяющихся словосочетаний из большего количества слов, включающих найденное словосочетание. Если да, то нужно сначала заменить переводом большое, и лишь затем малое словосочетание. В противном случае, как понимаете, поиск в документе будет затруднен.

Чем скрупулезнее вы проведете анализ текста на предмет повторяющихся конструкций, тем проще вам будет потом. Поэтому не жалейте усилий! Исходя из своего опыта, могу сказать, что тексты различаются по сложности в отношении этого анализа. Простым текстом я называю такой текст, в котором доля слов, входящих в повторяющиеся словосочетания, невелика, но велико количество повторений этих словосочетаний. Было бы полезно иметь более точный математический критерий оценки сложности текста, но у меня не хватает сил этим заниматься. Может быть, кому-нибудь удастся такой критерий вывести.
Приведу пример, что получается в результате анализа текста.

Оригинал
The divergent light conversion element 12 is configured to have positive power to convert divergent light (hereinafter, light beam P) emitted from the light source 11 into convergent light. That is, the divergent light conversion element 12 converts a divergent angle of the light beam P from the light source 11 to a convergent angle so as to form spots S in a predetermined size on the screen Sc.
Промежуточный текст
The элемент преобразования расходящегося светового пучка 12 приспособлен to have положительная сила преобразовывать расходящийся световой пучок (далее, световой пучок P) emitted from the источник света 11 в сходящийся световой пучок. That is, the элемент преобразования расходящегося светового пучка 12 преобразует a divergent угол светового пучка P from the источник света 11 to a convergent угол so as to form пятна S in a заранее определенный размер on the экран Sc.

2. Перевод

Теперь можно делать перевод на основе промежуточного текста. Я делаю это так. Располагаю два окна одно под другим: сверху – промежуточный текст, а снизу – окончательный перевод. Дальше беру целиком абзац промежуточного текста и копирую в окно перевода. Затем, в этом окне, заменяю непереведенные слова русскими, меняю слова местами, исправляю окончания, в общем, все это напоминает детский конструктор из кубиков. Раньше я просто писал перевод «на чистом листе» и вставлял переведенные куски из промежуточного текста. Однако практика показала, что такая методика может приводить к пропускам, особенно, если абзац большой или если рядом стоят похожие абзацы. Поэтому теперь я так не делаю. Кроме того, в технических текстах обычно встречаются весьма длинные и сложные с грамматической точки зрения предложения. Чтобы перевести такого монстра с чистого листа, нужно сначала полностью прочитать его, понять, перевести в уме и затем записать. При этом, естественно, могут возникать трудности перевода, над которыми задумываешься, теряя общий смысл фразы, после чего приходится опять смотреть на предложение в целом и т.д., пока, наконец, не забудешь перевести какое-нибудь слово. Приходится постоянно находиться в напряжении, что приводит к быстрому утомлению. Другое дело, когда ты копаешься в смеси русских и иностранных слов, можно потихоньку разбираться с отдельными кусками предложения, не опасаясь ничего потерять, таскать слова взад и вперед, стараясь улучшить удобочитаемость перевода, только нужно не забывать удалять уже ненужные иностранные слова. Работать можно с разной скоростью в зависимости от своего тонуса. Можно заменять сразу несколько слов подряд их переводом, а можно переводить слова по одному, если чувствуешь, что устал и внимание на нуле. Кроме того, при наличии в тексте идентичных фрагментов, а это случается нередко, удобно выделять их цветом. При окончательном переводе их можно копировать. Показываю, что получилось в результате перевода показанного абзаца.

Перевод
Элемент 12 преобразования расходящегося светового пучка приспособлен иметь положительную силу для преобразования расходящегося светового пучка (далее, светового пучка P), излучаемого источником света 11, в сходящийся световой пучок. Таким образом, элемент 12 преобразования расходящегося светового пучка преобразует угол расхождения светового пучка P из источника света 11 в угол схождения для формирования пятен S с заранее определенным размером на экране Sc.

Может, он и не очень изысканный, но зато ничего не потеряно. Однако возможно, что в переведенном тексте сохранятся пропущенные слова на языке оригинала. Чтобы выловить их, преобразовываем документ перевода в простой текстовый формат и открываем полученный текстовый файл все той же программой Concordance. Смотрим список слов и находим все нерусское. Далее решаем, что с этим делать.

В связи с вышесказанным, поделюсь общими соображениями относительно технического перевода и, в частности, патентов. Переводчик, конечно должен разбираться в той области техники, в которой он работает. Однако он редко бывает классным специалистом, и, кроме того, приходится работать в довольно обширной области, где просто невозможно все досконально понимать. Также нужно учитывать, кто пишет тексты. Далеко не все они в совершенстве владеют языком, на котором пишут. Именно в связи с этим полезен тот подход двухэтапного перевода, который я здесь пропагандирую. Наша задача – прежде всего, разобраться в основных терминах, применяемых автором, а они, как раз, чаще всего и повторяются. Многие авторы пользуются распространенными клише, которые можно однозначно перевести на русский, и которые также легко выловить с помощью программы анализа текста. После этого, нам остается навести порядок в грамматике, практически не вдаваясь в существо текста, тем более что иногда приходится только догадываться, что хотел сказать автор. Как ни прискорбно это звучит, мы выдаем лишь более или менее правдоподобную версию, но желательно, чтобы она пристойно выглядела на русском языке. На ум приходят строки из знаменитого стихотворения «Джабберуоки» из «Алисы в зазеркалье»: