Адрес РуТрекера для пользователей РФ - MainTracker.org

Расскажи друзьям:  

Параллельный Корпус

Страницы:  1

Ответить
Автор
Сообщение

LifeXacker

Стаж: 9 лет 1 месяц

Сообщений: 39


LifeXacker · 15-Янв-17 16:13 (1 год 8 месяцев назад, ред. 21-Апр-18 14:31)

[Цитировать] 

Добрый вечер!
Всех с прошедшими праздниками!
Хочу предложить новый тип раздач – книги и их переводы. Ее можно разместить в разделе "Коллекции книг и библиотеки".
Кому это нужно:
- переводчикам
- изучающим иностранные языки
- всем, кто время от времени имеет дело с переводами по своей специальности (например, ученые, собирающие информацию на английском языке для написания научной статьи).
Пожелания: отличное качество оцифровки + распознанный текст, прошедший вычитку (он может быть добавлен в книжки формата PDF и DjVu в виде текстового слоя или сохранен в формате Microsoft Word).
Для “выравнивания” (создания параллельного корпуса, где слева – оригинал, а справа – перевод) текстов используйте следующие программы:
- ABBYY Aligner – зарегистрируйтесь и заполните свой профиль на сайте https://ru.smartcat.ai, после чего отправьте запрос в службу поддержки с просьбой выслать вам эту программу. В ответ придет ссылка на ее скачивание и серийный номер.
- LF Aligner 4.1 – утилита одного венгерского программиста – https://sourceforge.net/projects/aligner
Все программы абсолютно бесплатны.
Как этот корпус может помочь Вам?
Перед началом перевода (будь-то большой проект или всего лишь одна небольшая научная статья):
- скачайте книги нужной вам тематики
- создайте на их основе корпус текстов в формате Microsoft Word (в виде двухколоночной таблицы, где слева будет оригинал, а справа – перевод) или TMX (файл памяти перевода – https://ru.wikipedia.org/wiki/Translation_Memory_eXchange)
- выполняйте поиск эквивалентов переводов в программе Microsoft Word или программе автоматизированного перевода (SDL Trados, MemoQ и другие)
- создайте пользовательский словарь под конкретный проект, чтобы не выполнять поиск одних и тех же эквивалентов дважды. Это можно сделать вручную (долго), либо с помощью модулей для извлечения терминов, встроенных в популярные программы для переводчиков - SDL MultiTerm Extract, PROMT Terminoloy Manager и др. Полученные словари можно добавить, например, в словарь Мультитран под своим ником, чтобы помочь развитию общедоступных онлайн словарей.
Возможно, этот проект даст импульс коллективной работе по созданию большого параллельного корпуса текстов. На сайте https://www.lingvolive.com/ru-ru уже давно существует такая база переводов, но по словам моего знакомого, который списывался с компанией ABBYY, добавление новых текстов не ведется уже долгое время, хотя ситуация уже могла измениться. К тому же, они не смогут включить в свой онлайн корпус все имеющиеся в мире книги и их переводы. Еще один замечательный многоязычный корпус переводов расположен здесь - http://context.reverso.net/translation. Готовые базы переводов можно будет включать в сами эти раздачи или специальные раздачи, где будут собраны одни только базы переводов.
Чтобы уменьшить размер будущей раздачи, ее можно будет разделить на несколько раздач по разным тематикам. Если найдутся желающие, то можно распределить разделы форума между добровольцами, задача которых – находить по всему Интернету оригиналы книг, переведенных на русский язык и выложенных на местном форуме. Для ускорения поиска выкладывайте в этой ветке ссылки на большие книгохранилища литературы на разных языках мира.
На данный момент у меня скопилось несколько десятков книг на тему финансовые рынки (технический и фундаментальный анализы рынков, стратегии трейдинга, Форекс, акции, опционы, инвестиции, IPO) и экономика. Если проект стартует, я могу сразу же предоставить их для раздачи, но для начала нужно будет правильно оформить названия книг.
Надеюсь, что эта идея многим покажется интересной.
Удачи!
[Профиль]  [ЛС] 
 

LifeXacker

Стаж: 9 лет 1 месяц

Сообщений: 39


LifeXacker · 21-Янв-17 21:50 (спустя 6 дней, ред. 19-Дек-17 14:14)

[Цитировать] 

Если сканирование, оцифровка и вычитка книг, а также компиляция словарей в формат Лингво, стали очень популярными занятиями, то почему бы нам вместе не открыть такое очень нужное направление, как создание корпуса переводов? Рано или поздно это точно свершится.
[Профиль]  [ЛС] 

zemburek

Стаж: 9 лет 2 месяца

Сообщений: 495


zemburek · 13-Июн-17 22:32 (спустя 4 месяца 23 дня)

[Цитировать] 

Простите, не знаю, в какой теме это было бы уместно:
есть у меня дома (деду в своё время подарили) брошюрка в арабской графике (шрифт, если не ошибаюсь похож на насталик), 1905 г. издания... О чём она -- без понятия (я сам лишь только-только подбираюсь к арабскому языку, и отсутствие огласовок или "выпендрёжные" шрифты, отличные от насха [не говоря уже об орнаментальной вязи!], -- ощутимо выбивают меня из колеи...)... Пока что единственный читаемый для меня текст в этой брошюрке гласит:
"ДОЗВОЛЕНО ЦЕНЗУРОЮ С-ПЕТЕРБУРГЪ 27 НОЯБРЯ 1905 года
ТИП. ШТАБА ТУРК. ВОЕН. ОКР. ВЪ ТАШКЕНТѣ"
-- Было бы интересно знать, -- что из себя представляет текст + на каком это языке...
Если заинтересует, -- могу сосканить и выслать титулку (теоретически можно было бы сосканить всё -- страниц там мало, но они уже довольно ломкие и ветхие)...
[Профиль]  [ЛС] 
 
Ответить
Loading...
Error