Паралельний корпус вікіпедія

Паралельний текст (паралельний текст) - текст на одній мові разом з його перекладом на іншу мову. «Вирівнювання паралельного тексту» - це ідентифікація відповідних один одному пропозицій в обох половинах паралельного тексту. Великі збори паралельних текстів називаються «паралельним корпусом» (англ. Parallel corpora). Вирівнювання паралельного корпусу на рівні пропозицій є необхідною передумовою для різних аспектів лінгвістичних досліджень. У процесі перекладу пропозиції можуть розділятися, зливатися, віддалятися, вставлятися або змінювати послідовність. У зв'язку з цим вирівнювання часто стає складним завданням.

Паралельний текст [| ]

У сфері досліджень в галузі перекладу «паралельний текст» - це поєднаний документ, що складається з версій відповідного тексту на вихідному і цільовому мовами. Паралельний текст створюються за допомогою спеціальних комп'ютерних програм, які називаються «інструментами для вирівнювання» (alignment tool) або «інструментами для паралельний текст» (bitext tool), які дозволяють автоматично вирівнювати оригінальну версію тексту і його переклад. Подібні програми, як правило, приводять у відповідність два тексти (оригінал і переклад) за кожною пропозицією. Збори паралельний текст називається «бітекстовой базою даних» або «двомовним корпусом» і може використовуватися в якості довідника і для пошуку потрібних поєднань.

Історія [| ]

Ідея паралельний текст належить Брайану Херріс (Brian Harris), який першим написав дослідження з даної концепції в 1988 році, і була згодом розвинена групою вчених при Університеті Монреаля (Université de Montréal), що називалася RALI (Recherche appliquée en linguistique informatique або Applied Research in Computational Linguistics - «Прикладні дослідження в обчислювальної лінгвістиці»). Група складалася з програмістів і лінгвістів, які вивчали природну обробку тексту. Відомими промоутерами концепції паралельний текст є П'єр Ізабель (Pierre Isabelle) і Клод Бедар (Claude Bédard).

Паралельний текст і пам'ять перекладів [| ]

Див. Також [| ]

Примітки [| ]

Література [| ]

  • Ушакова Т. Новомосковськ паралельні тексти (Детальний опис методики читання паралельних текстів).

Посилання [| ]

Паралельні корпуси в Інтернеті [| ]

Програми для вирівнювання паралельних текстів [| ]

  • hunalign - повністю автоматичне засіб, що враховує статистику перекладів окремих слів, але вимагає достатнього великого корпусу для надійної роботи
  • Trados Winalign
  • Wordfast tools - реалізовані у вигляді набору макросів MS Word, на відміну від програми Wordfast. працюючої як пам'ять перекладів. засоби вирівнювання (для поповнення ПП) доступні безкоштовно.
  • ABBYY Aligner - програма для ПК, що дозволяє автоматично вирівнювати паралельні тексти.

Документація [| ]