Автоперевод в контентмейкинге: как сделать машинное живым
Знания языков открывают новые горизонты для создания контента: у иностранных коллег можно подсмотреть новые тренды и найти различную информацию, которая может стать основой для очередного поста или видео.
Однако, будем честны, мало кто для такого вида работы пользуется услугами профессиональных переводчиков. Куда проще взять текст и загрузить его в машинный переводчик целиком. И тут мы встречаемся с новой проблемой - многие пользователи отмечают, что такой текст звучит неестественно.
В этой статье мы на примерах рассмотрим, как сделать так, чтобы машинный звучал более приятно для русскоязычной аудитории.
Тренируемся на Реддите - DeepL
Для того, чтобы проанализировать ошибки, которые способен совершить машинный перевод, обратимся к Реддиту и загрузим историю оттуда, как сейчас делают некоторые каналы в разных соц. сетях, в 3 нейронных машинных переводчика. Что представляют собой именно нейронные машинные переводчики вы можете прочитать в статье Нейронный машинный перевод: что это?
Используем в качестве первого примера отрывок из поста, где автор пытается пересказать сюжет фильма “Назад в будущее” от первого лица на Реддите. Первый абзац загрузим в переводчик DeepL:
“Я опаздываю в школу. Как я проспал все 200 часов в спальне, ума не приложу. Зачем мне столько часов? Я ничего не помню о прошедшей ночи, а я все еще одет. Очевидно, я только что так сильно завалился, что мне потребовалось немного "Хьюи Льюиса и новостей", чтобы проснуться”.
Перевод многозначных слов
Первая ошибка, на которую стоит обратить внимание это неправильное понимание со стороны автоматического переводчика слов, имеющих несколько значений. Фраза “я проспал все 200 часов в спальне” может показаться простым преувеличением времени, однако главный герой проспал не 200 часов, а 200 будильников.
Слово “clocks”, использованное в оригинале, имеет как значение “настенные часы”, так и “будильник”, и в тексте же имелось в виду именно второе. Когда мы имеем дело с многозначными словами, чтобы найти правильное значение, можно обратиться как к двуязычным словарям, таким как, например, Multitran.
Уточнения
Далее стоит обратить внимание на уточнение “в спальне”. Английский язык отличается достаточно высокой точностью в таких аспектах, но часто при переводе на русский эта точность становится излишней. Более естественным для русского языка вариантом будет опустить это уточнение совсем.
Уточнения также прослеживаются и в повторении местоимения “я”, что довольно характерно для английского языка, но совсем не характерно для русского. Например в предложении “Я ничего не помню о прошедшей ночи, а я все еще одет”, “я” во второй части предложения можно опустить без потери смысла.
Однако, в последующих предложениях мы видим противоположную ситуацию: слово “завалился” без слова “спать” после него звучит неестественно, а название "Хьюи Льюис и новости" больше напоминает новостную программу, и требует уточнения о том, что это музыкальная группа. Эти два приема в теории перевода называются опущение и добавление.
Перевод имен собственных
Говоря о музыкальной группе стоит упомянуть еще одну ошибку, которая часто встречается в машинном переводе: перевод имен собственных. Дело в том, что музыкальные группы, магазины, фамилии, компании и многие другие названия не принято переводить совсем.
То есть в случае музыкальной группы на ваш выбор можно либо оставить полностью английский вариант “Huey Lewis and the News” либо написать название русскими буквами “Хьюи Льюис энд зэ Ньюс”.
Тренируемся на Реддите - Lingvanex
Далее, чтобы проанализировать другие виды ошибок и не повторяться, обратимся к другому тексту и к другому нейронному машинному переводчику - Lingvanex. Переведем абзац из поста про сны:
“Ранее на этой неделе, в воскресенье вечером, мне приснился сон, в котором я знал, что сплю. Ночью меня стояли возле дома под проливным дождем и думали, что мне нужно проникнуть внутрь, чтобы проснуться. Я подошел к входной двери и положил костяшки пальцев на окно двери, готовый постучать. Я знал, что мое следующее действие приблизит меня на шаг к сознанию. В тот момент, когда я постучал в дверь, стук стука был таким громким, таким пугающим и таким реальным, что разбудил меня от сна.”
Пассивные и активные конструкции
Машинные переводчики не всегда способны правильно определить, какую конструкцию нужно выбрать. Активные конструкции предполагают, что некто делает что-то, а пассивные конструкции предполагают, что действие делается над кем-то.
В этом абзаце был использован разговорный вариант фразы “I was stood”, компьютерный переводчик понял как “меня стояли” и переделал активную конструкцию в пассивную. В оригинале же фраза означала “я стоял”
Здесь, конечно, нельзя говорить о том, что это хороший пример ошибки в контексте пассивной и активной конструкции, так как вариант, написанный в оригинале не используется широко в английском языке и даже считается неправильным, но если вы переводите разговорную речь, то такие примеры будут вам встречаться.
Тавтология
Тавтология предполагает повторение слов со схожим или одинаковым корнем рядом в предложении. В приведенном отрывке такое встречалось несколько раз: “подошел к входной двери” и “положил костяшки пальцев на окно двери” в одном предложении и “стук стука”.
В таких случаях стоит заменять второе слово местоимением или словом схожим по значению, чтобы не было повторения. Однако, в следующем предложении в отрывке повторение слова “таким” нельзя назвать тавтологией, так как его роль здесь - усилить эффект сказанного.
Тренируемся на Реддите - Google
Перейдем к отрывку из другого поста и к переводчику Google, уже рассмотренные ошибки комментировать не будем:
“Я обратился к ближайшему человеку. Это была девушка, читающая газету, и попросила ее сфотографировать меня. Поговорил с ней. И ее первый день в Лондоне. Мы решили осмотреться и заблудились, так как у нас обоих ужасное чувство направления, провели день, погруженные в смех, и около 10 раз непреднамеренно видели, как строятся Ллойды. Она была квебеккой и почти не говорила по-английски. Тем не менее, нам очень понравилось.”
Непостоянство рода
Машинный переводчик часто меняет род одного и того же лица. Например здесь в первом предложении рассказчик предстает перед нами как мужчина, а во втором уже как женщина. При использовании машинного перевода, конечно, стоит обращать внимание на род существительных по всему тексту.
Реалии
“Ллойды” будут совершенно неясным понятием для русскоязычной аудитории. Эта фраза в таком контексте является реалией, словом которое обозначает некую составляющую определенной культуры или страны. Вероятнее всего здесь имелись в виду банки Ллойд, однако чтобы русскоязычному читателю или зрителю это понять понадобиться уточнение.
Здесь также стоит упомянуть кто такая “квебекка”. В этом контексте автоматический переводчик принял решение просто написать это слово русскими буквами, однако на самом деле в англоязычных странах так называют жителей канадской провинции Квебек. Но в русском такого слова нет.
Связность слов
Дословность перевода часто приводит к тому, что во фразах и словосочетаниях оказываются слова или словосочетания, которые в языке перевода вместе не используются.
Если вы переводите текст с помощью машинного переводчика и у вас возникают сомнения по поводу того, говорят ли на русском “чувство направления” или “ непреднамеренно видели”, вы можете обратиться к поиску по n-граммам в Корпусе русского языка или в Google Books Ngram Viewer.
Вывод
Несмотря на то, что машинный переводчик является полезным ресурсов для контентмейкеров, он все еще способен совершать ряд ошибок, которые влияют на то, насколько естественно звучит текст.
Автоматический перевод, однако, обладает значительными преимуществами, когда мы говорим о создании контента: он быстро справляется со своей задачей и не требует финансовых вложений.
Обращая внимание на описанные в этой статье ошибки, вы сможете улучшить качество переведенного текста так, чтобы никто и подумать не мог, что перед ним машинный перевод.