Блог

Разбиение на абзацы: перевод книг по предложениям.

По предложениям книги переводить несравненно удобнее, чем по абзацам, например, не надо добавлять новый вариант всего абзаца, если в существующем переводе не нравится только предложение. Комментировать не всегда вариант, потому что есть переводчики, которые редко возвращаются к чтению комментариев и редактированию текста.

Но вот чтобы переводить текст по предложениям, надо его разбивать по предложениям при загрузке, и в этом случае теряются границы абзацев, в готовом переводе каждое предложение становится абзацем, теряется структура оригинала. Хотелось бы, чтобы и переводить удобно было, и читалось чтобы все окей.

Для этого предлагаю ввести новую опцию двойного разбиения, которая сначала разбивает текст на абзацы (по переносу строки), а затем абзацы - на предложения (по точкам, ну или варианты, в зависимости от того, в каком виде оригинал). В двухколоночном "рабочем" варианте перевода пусть все остается как есть по предложениям, а вот чтобы готовый перевод главы имел структуру оригинала.

Думаю, такое осуществить несложно, например, можно вставлять в текст специальные метки-слова по границам абзацев, например x---конец абзаца---x, которые при генерации готперевода будут заменяться тегами параграфа, и больше эти тэги не вставлять (но это будет работать только при условии, что производится текст книги, а не субтитры). Но это как вариант, возможно, кто придумает схему получше.

Могу помочь с кодом процессинга текста в php, если, конечно, он процессится в php, хотя не думаю, что это слишком уж сложно провернуть.

Написал flamencist • 06.03.10 21:10 • предложения и багикомментировать 8

Пользуясь случаем, замечу еще один маленький баг, для которого не стоит открывать отдельную ветку, а именно:

При вводе текста оригинала, при разбиении по точкам, когда попадается предложение с прямой речью, в котором точка стоит перед замыкающими кавычками, например

>"bla bla bla", - he said, - "bla bla."

эти самые замыкающие кавычки становятся в следующий абзац. Конечно, в переводе этого переводчики могут и не допустить, но раздражает.

Устранить этот баг можно парой кликов мыши: вместо разделителся "." в коде назначить разделитель ". ". Будет работать, пока не дойдет до конца абзаца, потому что там после точки пробел не идет. Но это решаемо, если проводить сначала разбиение на абзацы, а затем по предложениям :)

flamencist - 06.03.2010 21:41 | (ответить)

И еще одно пожелание - я конечно, понимаю, что ресурс больше заточен под перевод субтитров, да их переводы и популярнее, однако:

Хотелось бы добавить возможность перевода названия глав в книгах, и возможность генерации готового перевода всего текста книги за один клик (затем и требуется перевод названия глав), а не только поглавного перевода.

flamencist - 06.03.2010 21:45 | (ответить)

ИМХО, перевод текста по абзацам несравнимо удобнее, чем по предложениям. Необходимо вставлять предложения на языке перевода в контекст хотя бы на уровне абзаца, не говоря уже о макроструктурах.

Bu1k4 - 08.03.2010 22:08 | (ответить)

Но это кому как удобнее, дело вкуса уже. Можно ведь и не удалять старую опцию, пусть будет выбор.

flamencist - 08.03.2010 22:17 | (ответить)

Кстати, можно и ввести указания на абзацы (шоколадно, конечно) - например, выделять группу предложений одного абзаца одним полутоном, чередуя полутона (как сейчас модно делать в таблицах).

flamencist - 08.03.2010 22:26 | (ответить)

тоже вариант, либо играть с фоном. Чуть темнее, чуть светлее.

Bu1k4 - 08.03.2010 23:00 | (ответить)

ну я фон и имел в виду в общем-то, разве что не конкретизировал )

flamencist - 08.03.2010 23:39 | (ответить)

я подумал о изменении цвета шрифта... тогда да, это было бы удобно

Bu1k4 - 08.03.2010 23:43 | (ответить)

Ответить:
Анонимно
Войти на сайт
Зарегистрироваться

CAPTCHA
Введите буквы, которые вы видите на картинке:


(вы не вошли на сайт и комментарий будет анонимным!)