Санкт-Петербургский университет
   1   2   С/В   3   4   
   6   С/В  7-8  9  10-11
   12-13  14 - 15  16  17
   18  19  20  21  22  23
   C/B   24  25 26 27 
ПОИСК
На сайте
В Яndex
Напишем письмо? Главная страница
Rambler's Top100 Индекс Цитирования Яndex
№ 22 (3745), 30 ноября 2006 года
образование

Еще не Три-Пи-О, но...

Как должен выглядеть компьютерный перевод? Очень просто, верно? Чем-то похоже на ксерокс: закладываешь в машину текст на английском, а получаешь — на русском... Идею возможности создания механической машины-переводчика уже в середине XIX века высказал Чарльз Бэббидж, известный английский математик. Опыты в этом направлении начались только с появлением электронных компьютеров в 40-е годы XX века. В 60-е годы в разработку автоматических электронных переводчиков вкладывались огромные средства, казалось, что машина в скором будущем заменит переводчика. Как только появились компьютеры — еще даже не “PS-юшки”, а большие, шкафоподобные — так сразу захотелось, чтобы они, как золоченый человекоподобный робот Три-Пи-О в “Звездных войнах”, переводили с любого языка на любой другой... Но, увы, такое сегодня невозможно. До сих пор программы для перевода даже письменных текстов, не говоря уж об устной речи, не могут соперничать с переводчиком в качестве. Язык оказался крепким орешком, он гораздо более сложен, чем, скажем, меры веса или объема.

А.В.Ачкасов

А.В.Ачкасов

Но программы автоматизации перевода действуют. И компьютер может ускорить труд переводчика в несколько раз. Поможет его оптимизировать, улучшить качество перевода. Об этом мне рассказал доктор филологических наук Андрей Валентинович АЧКАСОВ, заведующий лабораторией письменного перевода. Лаборатория была создана в июне 2006 года на филологическом факультете СПбГУ, при кафедре английской филологии и перевода. На недавней VIII юбилейной международной конференции по переводоведению “Федоровские чтения-2006” А.В.Ачкасов с успехом провел мастер-класс “Средства автоматизации перевода”.

В лаборатории сегодня 12 компьютерных мест для студентов (или переводчиков) и мастер-компьютер — у преподавателя (или менеджера проекта).

— Университет закупил лицензионный софт: программы работают без сбоев, регулярно получаем обновления, — рассказывает Андрей Валентинович Ачкасов. И показывает, как работают программa переводческой памяти SDL-TRADOS, автоматический переводчик PROMT, программы индексации текста, электронные словари и терминологические менеджеры.

Программа переводческой памяти работает так: на экране монитора вверху голубая линейка, на ней английская фраза, а ниже линейка желтая — здесь появляется перевод на русский язык (если программа может перевести выбранный для перевода сегмент, то есть «знает» перевод – в ее памяти есть перевод подобного сегмента). Таких фраз мы просмотрели несколько. Но вот одно из словосочетаний машина видит впервые — поэтому перевода нет. Андрей Валентинович сам делает перевод сегмента, и он автоматически попадает в переводческую память. Справа — фрагмент текста, серым подсвечены те слова, для которых в памяти нет готового перевода.

Электронная “записная книжка переводчика”

— Откуда машина знает перевод слов и словосочетаний? По словарю?

— Это новое поколение программ — переводческая память. Они сегодня наиболее востребованы на переводческом рынке, западные заказчики предпочитают, чтобы переводчики работали именно с этим софтом. Но программы переводческой памяти сами не переводят, это лишь пустая оболочка. Ее наполняют и организовывают “под себя” переводчики. Когда над крупными проектами работает целый переводческий коллектив, программы переводческой памяти позволяют оперативно просматривать работу всех переводчиков проекта и, таким образом, получать от программ «подсказки» в виде уже переведенных сегментов. Обмен памятью осуществляется через менеджера проекта. Программа поддерживает любые языки (первый в списке — африкаанс).

Возьмем для примера реальную задачу, которую мы недавно решали: нужно было перевести порядка 1000 страниц для целлюлозно-бумажного комбината. В проекте работали 10 переводчиков, сроки ограничены. Как оптимизировать работу?

Если нет готовой переводческой памяти по данной тематике (ее может предоставить заказчик), то переводчики начинают работать с «пустой» памятью, однако каждое переведенное предложение в памяти фиксируется и, таким образом, пополняет ее. Предположим, что каждый из десяти переводчиков перевел за два дня 10 страниц. Менеджер проекта редактирует эти переводы и соединяет их в единую переводческую память. Таким образом, через два дня работы проекта каждый переводчик получит память в 100 страниц текста и сможет оперативно пользоваться результатами работы других переводчиков. Например, если я хочу узнать, как до меня перевели тот или иной термин, я могу это сделать, не просматривая все сто (тысячу, десять тысяч) страниц, программа сама отберет нужный мне материал.

Вот здесь, как вы видите по цвету на экране, основная часть текста переведена. Так происходит из-за того, что в специальных текстах всегда встречаются сходные фрагменты. Например, в договорах или инструкциях встречаются стандартные формулировки — типа “стороны заключили договор”, и такие сегменты могут совпадать на 50%, 70%, а то и на все 90%. Раньше, без программы, надо было пойти по тексту — найти повторы — скопировать — вставить — отредактировать. Программа переводческой памяти предлагает похожие сегменты сама и показывает цветом, в каких именно частях сегменты различаются. Кроме того, менеджер проекта и сами переводчики в процессе работы над проектом создают общую терминологическую базу, которая также доступна для общего пользования в специальном окошке. В итоге, что очень важно для коллективной работы, все переводчики унифицированно переводят термины, хотя ни разу не общались напрямую! А по мере необходимости я (менеджер) рассылаю им обновление памяти и терминологической базы.

Занятие в группе переводчиков

Занятие в группе переводчиков

— А перевод терминов откуда? Тоже вы ищете их и координируете перевод?

— В программе TRADOS есть приложение для извлечения терминологии MultiTerm Extract. Оно отмечает, сколько раз встречается тот или иной термин, фраза в тексте: 20, 57 или 3 раза. По этой статистике я отбираю терминологические кандидаты и перевожу их. Если существует готовая переводческая память, то программа извлекает терминологию с ее возможными переводами. Аналогичный терминологический менеджер есть и у программы PROMT, которая переводит извлеченную терминологию автоматически. В зависимости от терминологической насыщенности текста программы извлекают разное количество терминов. И теперь переводчик может не искать их в словарях, не искать их в Интернете, они есть в общей терминологической базе.

Если встречается сложный термин — например, “плавающая головка для нанесения краски на бумагу”, то этот термин приходится искать в специальных корпоративных глоссариях, в текстах сходного содержания, которые можно получить от заказчика или найти в Интернете. Если термин еще не переводился – явление нередкое, если речь идет, например, о новой технологии, новом узле механизма и так далее – то приходится «изобретать» его перевод по аналогии с существующей терминологией и консультируясь со специалистами в данной области. Но раз «найденный» и занесенный в базу перевод используется всеми переводчиками проекта и избавляет их от необходимости проделывать аналогичную работу. Компьютерная программа позволяет сделать перевод терминологически единообразным.

Раньше в подобной ситуации переводчикам предлагались терминологические листы в распечатанном или стандартном электронном текстовом формате. Но переводчик может полениться посмотреть этот список, может забыть про него или пропустить слово. А тут все просто: в окошке терминологической базы перевод терминов появляется автоматически, и не надо о них помнить.

Ускоряет работу вдвое

— Чем еще могут помочь средства автоматизации перевода?

— Допустим, я перевел 500 страниц и беру

501-ю. Анализирую текст и вижу: совпадает по сегментам с известными на 56%. Не совпадают только общие фразы, а их легко перевести. Подключаю приложение P4T (PROMT для TRADOS’a), и он “латает дыры”. В итоге получаем “лоскутный” перевод — из сегментов памяти и из PROMTа, его уже можно редактировать. Такая стратегия эффективно применяется при работе с текстами, имеющими высокую степень повторяемости сегментов.

Западные заказчики, кстати, не платят дважды за повторяющиеся сегменты (это, как правило, предложение до точки). Если фрагменты совпадают почти полностью и отличаются только несколькими словами, то заплатят лишь за перевод этих слов.

Еще реальный пример: за месяц нужно приготовить значительный объем учебных материалов по менеджменту (более 2000 страниц). Мы в этой области прежде не работали. Как решать эту задачу?

Первый шаг – терминологический анализ материала, создание первичной терминологической базы (в основном это «общий» терминологический фон, наиболее часто встречающаяся терминология). Желательно включить в терминологическую базу наиболее ходовую терминологию по данной тематике и создать переводческую память на основе параллельных текстов, которые можно получить от заказчика, найти в Интернете или купить (например, документы Международной организации по стандартизации – ISO, документы ГОСТ). Из созданной таким образом памяти удобно извлекать терминологию, программа позволяет сделать это за несколько минут, редактирование результатов, конечно, занимает больше времени. Кроме того, полезно создать и моноязычный корпус текстов – можно, после предварительного отбора, закачать целые сайты по данной тематике и проиндексировать их, что позволит переводчикам оперативно просматривать контексты, проверять правильность своих вариантов словоупотребления. Это особенно важно, если перевод осуществляется на неродной язык.

Кроме того, предварительная работа предполагает поиск в Интернете глоссариев и словарей по данной тематике – по менеджменту их десятки. Эти словари также полезно закачать целиком и проиндексировать, что позволит переводчику осуществлять поиск сразу во всех словарях.

Итак, теперь у нас есть: а) переводческая память, б) терминологическая база, в) проиндексированный корпус текстов, г) проиндексированный корпус словарей, д) автоматический переводчик PROMT... Описанные мной процедуры предпереводческой работы — не дело переводчика. Это работа менеджера проекта, и она ускоряет работу коллектива, как показывает опыт, раза в два-три. В итоге сроки и качество перевода выше, а цена — ниже, налицо удешевление и ускорение работы.

— Вы уже несколько раз упомянули автоматический переводчик PROMT. Что это такое? И почему его одного недостаточно?

— Когда в 1960-е годы стали появляться переводческие программки, их делали по схеме: программа, анализируя исходный текст, расчленяла его на составляющие. Затем переводила “поштучно” и генерировала новый текст. Различия заключаются в типах анализа текста («сверху», «снизу», особенности и мощности «движка» и так далее) Пробовали разные пары языков, разные способы анализа, но результат пока неутешителен: полноценно воссоздать реальный человеческий язык компьютер не в силах. Тем не менее автоматические переводчики — серьезное подспорье в работе профессиональных переводчиков и незаменимый инструмент для тех, кто, не зная языка, хочет быстро получить общее представление о содержании текста (документа, письма, описания прибора)

В лаборатории 12 компьютерных мест для студентов

В лаборатории 12 компьютерных мест для студентов

Программа PROMT — один из таких автоматических переводчиков, самый популярный. Многие смеются над результатами работы программы (Андрей Валентинович продемонстрировал, как неуклюже PROMT переводит текст — впечатление такое, будто это делал иностранец). Но, во-первых, программа и не призвана давать полноценный перевод, а во-вторых, те, кто работает с этой сложной программой, не в полном объеме используют и знают ее возможности! А ведь у PROMT’а масса полезных функций и приложений, позволяющих оптимизировать работу переводчика, есть терминологический менеджер, ассоциированная память, гибкая работа со словарями и другие возможности.

PROMT позволяет создавать пользовательские словари, к которым программа обращается в первую очередь, и это позволяет оптимизировать работу на уровне терминологии, снимает те самые проблемы, которые так часто вызывают улыбку. И еще, для того, чтобы эта программа работала качественнее, нужно осуществлять предпереводческое редактирование текста, синтаксически упрощать текст. Это позволяет значительно улучшить результаты работы, и этому мы обучаем на наших семинарах.

Как это по-русски будет?..

— Средства автоматизации перевода работают только с текстовыми форматами?

— Нет, программа переводческой памяти может работать не только с текстовыми форматами (DOC, RTF, TXT), но и с со многими другими (HTML, HTM, JSP, ASP, PHP, XML и другими) Для этого у SDL-TRADOS есть специальный инструмент, приложение TagEditor.

Андрей Валентинович показывает мне первую страничку на сайте TRADOS’a и открывает ее для редактирования при помощи приложения TagEditor. На экране появляется много всяких значков слева, а потом и знакомые буковки английского текста.

— Мы видим HTML-файл в виде доступного для редактирования текста, тэги представлены в виде геометрических фигурок (здесь нет привычных картинок и гиперссылок). Теперь перевод этого HTML-файла происходит по тому же сценарию, что и перевод обычного текстового документа. В итоге мы получим ту же страничку, но с русским текстом.

Кроме того, программа может переводить меры длины, веса, объема. Давайте, для примера, переведем какие-нибудь 12 футов в сантиметры. Для компьютерной программы никакого труда не составит. Одно нажатие клавиши, и мы получаем: 365,76 см. Так же можно перевести литры — в галлоны или пинты, а центнеры — в пуды... А можно переводить дни недели, время (с учетом часовых поясов).

— Чем может переводчику помочь Интернет, кроме поиска словарей?

— Информационный и лингвистический поиск в Интернете позволяет получить необходимую для перевода фоновую информацию, найти изображения того, о чем идет речь (узла механизма, элемента декора, аксессуара и так далее; без этого иногда невозможно правильно понять текст оригинала, а, значит, и перевести его), понять значение термина или выражения, просмотрев его употребление в разных контекстах. Наш партнер Юлиан Валерьевич Тиссен, директор SDL Russia, обобщил способы информационного и лингвистического поиска в Интернете в хорошо известной статье «Интернет в работе переводчика», доступной на сайте Союза переводчиков России. Именно эта статья и семинар, который проводит Ю.В.Тиссен, помогли многим переводчикам, мне лично, научиться эффективно пользоваться ресурсами Интернета.

Андрей Валентинович пишет в поисковом окне Google фразу в кавычках: “size press”. И довольно быстро находит перевод: клеильный пресс.

— Или я сомневаюсь: как перевести на английский выражение “дополнение бренда” — как “brand extension” или “brand stretching”? Интернет дает ответ на этот вопрос. Иногда возможны сразу несколько вариантов перевода, в этом случае Интернет дает шанс выяснить, какой вариант более частотный, а значит, и более употребительный.

По моей просьбе Андрей Валентинович проверяет, как правильно назвать их профессиональный праздник: Международный день переводчика, Международный день перевода или Всемирный день перевода? Через несколько секунд получаем статистические данные поиска в Google: около 20 000, 40 и 230 (соответственно по каждому из вариантов).

— Статистика Интернета может помочь, если заказчик предъявляет претензии к переводу. Кроме того, в сети можно проверить должности официальных лиц, названия подразделений — на официальных сайтах учреждений и компаний. Даже если перевод не очень хороший, с точки зрения общепринятых правил перевода, — мы будем ориентироваться на официальную, а следовательно, единственно правильную версию.

А если говорить о словарях, то их теперь великое множество. У крупных компаний есть свои глоссарии — многоязычные, двуязычные или одноязычные — например, KODAC glossary. Если же перевода термина просто не существует, то переводчик, ориентируясь на существующий контекст, сам предложит вариант перевода. И к нему потом будут обращаться авторы-составители словарей.

Роулинг, ТолкиEн и Шварценеггер

— А как быть с художественным переводом? Можно ли его автоматизировать — или это вещь сугубо творческая?

— Мастерство художественного перевода состоит в том, что переводчик в состоянии перевоплотиться, “прожить” текст чужого автора. Для этого нужен талант, особый переводческий дар. Можно научить рядового переводчика неплохо передавать мысли автора, видеть и учитывать стилистические особенности произведения. Но получим ли мы на выходе текст, соизмеримый по своим художественным достоинствам с оригиналом? Низкопробные переводы прозы столь же низкого качества появляются в огромном количестве, и работают над этими переводами нередко несколько человек одновременно. Программы переводческой памяти могут лишь отчасти повысить в этом случае качество перевода: менеджер перевода может унифицировать для всех участников проекта перевод имен собственных, реалий, часто повторяющихся оборотов (как, например, характерной фразы Шварценеггера: “I’ll be back!”). Менеджер может задать «тон» перевода, и остальные переводчики будут стараться соответствовать его стилю. Но, повторю вновь, такую работу нельзя считать полноценным художественным переводом!

Есть и еще важный момент. Каждое произведение несет в себе импликационал – это то, что неявно содержится в тексте, то, к чему текст отсылает не прямо, а косвенно. Переводчики “Гарри Поттера” плоховато разобрались в реалиях из истории Англии. Джоан Роулинг — англичанка и пишет о своей родной стране. А человеку, незнакомому с культурой страны оригинала, будет непонятно очень многое в словах и поведении героев. Потому что говорится об этом лишь намеками...

— Да, как у нас в 70-80-е годы интеллигенция общалась с помощью фраз из “Мастера и Маргариты”. Или словечек из популярных фильмов. Например, все знают: “Надо, Федя, надо!”, “Стреляли...”, или “Рукописи не горят”, “Осетрина не бывает второй свежести”, или “Жить хорошо. А хорошо жить еще лучше...” Наверно, если переводить каждую их этих реплик на английский или японский, то надо как-то комментировать глубину смыслов. В английском, видимо, то же самое — если судить, хотя бы, по переводам “Алисы в Стране Чудес”. И у Толкина сложностей уж не меньше?

— В каждом художественном произведении присутствует пласт культуры. Чтобы его раскрыть и адекватно передать по-русски, переводчику приходится зарываться в книги по страноведению, по истории страны, вылавливать подробности в комментариях. Но вот для филологического анализа импликационала художественного текста и способов его передачи средства автоматизации перевода могут быть очень полезны.

Например, аспирантка Елена Третьякова написала диссертацию по Толкину и использовала для анализа, в том числе, и средства автоматизации перевода. Она как раз изучала, насколько адекватно в русских переводах “Властелина колец” передан имплиционал оригинального текста. Ведь Дж.Р.Р.Толкин — профессор Оксфорда, специалист по английской литературе и кельтскому эпосу, и в тетралогии у него множество аллюзий на эпос, какие-то литературные реминисценции. Названия местностей, имена героев, реалии романа — они “говорящие”, их смысл переводчикам надо раскрыть и адекватно передать по-русски.

С помощью средств автоматизации возможен анализ перевода или нескольких переводов одного и того же текста, исследование переводческих стратегий, которые использовались до тебя.

Попугай пересаживается
на компьютер

— В лаборатории письменного перевода вы уже и студентов начали обучать?

— Да, автоматизированные системы перевода с этого года введены в программу обучения студентов английского отделения. Пятикурсники обучаются, выполняя конкретные заказы на перевод (и даже за деньги). В интерактивном режиме мы обучаем их решать переводческие задачи при помощи инструментов автоматизации перевода. Освоение компьютерных программ позволяет переводчику понять простую вещь: он может сориентироваться в любой сфере и найти нужное решение. Без всякой оторопи: “Ой, я никогда не переводил для целлюлозно-бумажной промышленности!..” Те, кто освоит программы, потом смогут работать в переводческих бюро, в которых стандартным стал вопрос: «Вы работаете с программами переводческой памяти?

Вместе с Юлианом Валерьевичем Тиссеном, выпускником филологического факультета и директором SDL Russia, мы вместе пишем учебник по автоматизированным средствам перевода.

...В лаборатории письменного перевода на столе — флажок со значком кафедры английской филологии и перевода. Симпатичный попугай держит в лапках листок с девизом: “Relata refero” (в переводе с латыни: рассказываю рассказанное). Но, похоже, скоро надо будет рисовать попугая, сидящего на клавиатуре компьютера. Или на мониторе...  

Вопросы задавал Евгений Голубев
Фото Сергея Ушакова

© Журнал «Санкт-Петербургский университет», 1995-2005 Дизайн и сопровождение: Сергей Ушаков