Додаток B. Глосарії

1. Використання
2. Формат файлів
3. Як створювати глосарії
4. Пріоритетний словник
5. Типові проблеми, що виникають під час користування глосарієм

Глосарії — це файли, які створюються та оновлюються вручну для використання в OmegaT.

Якщо їх підключити до проєкту OmegaT, то у вікні Глосарій можна буде побачити вирази, що знайдені для активного сегмента.

Ви визначаєте місце розташування та назву глосарія у діалозі Властивості проєкту. Розширення має бути .txt чи .utf8 (якщо його не вказати, воно буде додане автоматично). Файл глосарія має знаходитися у теці ./glossary, але він може також бути у глибшій теці (наприклад, ./glossary/sub/glossary.txt). Цього файлу може і не бути на той момент, коли ви вказуєте його у властивостях проєкту. У цьому випадку він буде створений, коли ви додасте перший запис у глосарій. Якщо файл вже існує, то він не перевіряється на валідність формату чи кодування. Нові записи завжди додаються у табульованому форматі та кодуванні UTF-8. Ці зміни не зачіпають вже наявний вміст, тож у випадку помилки пошкодження файлу будуть мінімальними.

1. Використання

Щоб використати власний глосарій, просто розмістіть його у теці ./glossary після створення проєкту. OmegaT автоматично розпізнає файли глосаріїв у цій теці, коли відкривається проєкт. Терміни у виділеному сегменті, які OmegaT бачить у глосаріях, відображаються в області Глосарій:

Рисунок B.1. Область Глосарій

Область Глосарій

Термін оригіналу стоїть перед знаком =, а після = зазначений його переклад. Також до словникової статті можна додати коментар. Функція глосарія залежить від наявності токенізації для кожної конкретної мови. Якщо токенізації для вашої мови немає — флексії не розпізнаються, і будуть знаходитися лише точні збіги зі словами в сегменті оригіналу. Якщо ж токенізація для вашої мови є — знаходитимуться і флективні форми слів. Нові терміни можна додавати до глосарія вручну під час перекладу, наприклад, у текстовому редакторі. Щойно ви збережете файл глосарія, зміни стануть доступні у програмі.

Термін оригіналу не обов’язково має бути однослівним. Він може виглядати так:

Рисунок B.2. Приклад кількох статтей глосарія до одного терміна оригіналу

Приклад кількох статтей глосарія до одного терміна оригіналу

В області глосарія відображується український відповідник підкресленого терміну «file filters» — «фільтри файлів». Якщо виділити слово в області глосарія, клікнути правою кнопкою миші та натиснути Вставити вибране, тоді слово вставиться на місце курсора в сегменті перекладу.[2]

2. Формат файлів

Файли глосарія — це прості текстові файли, у яких терміни мов оригіналу та перекладу сформовані у колонки, відділені одна від одної табуляцією. Перша колонка містить термін оригіналу, друга — перекладу. У третій колонці можна зазначати додаткову інформацію (коментар). Друга колонка може бути порожньою, тобто, можна додавати у глосарій термін без перекладу, лише з коментарем.

Кодування глосаріїв визначається автоматично. Звісно, кодування має бути сумісне з обома робочими мовами, тож ми рекомендуємо використовувати Unicode.

Також підтримується і формат CSV. Цей формат не відрізняється від формату файлу з табуляцією: термін оригіналу, термін мовою перекладу. Поля коментарів відділяються комою «,». Якщо потрібно використати кому всередині запису, стрічку можна брати у лапки:

"This is a source term, which contains a comma","це термін, що містить кому"

Крім формату простого тексту підтримується також формат TBX, однак, лише для читання. Файл .tbx має знаходитись у теці ./glossary, але він може також бути у глибшій теці (наприклад, ./glossary/sub/MyGlossary.tbx).

TBX (Term Base eXchange) вільний стандарт для обміну структурованими термінологічними даними, що базується на XML. LISA та ISO визнали TBX міжнародним стандартом . Якщо у вас є програма для роботи з термінологією, дуже ймовірно, що вона експортує дані саме в форматі TBX. Microsoft Terminology Collection можна завантажити майже 100 мовами світу та використовувати як основний глосарій для перекладів у галузі IT.

Зверніть увагу: експортовані з MultiTerm файли у форматі .tbx не дуже надійні (станом на листопад 2013 року). Маючи справу з MultiTerm, краще використовувати формат .tab .

3. Як створювати глосарії

Налаштування проєкту дають можливість ввести назву для того файлу глосарія, який можна буде редагувати (детальніше на початку розділу). Щоб створити новий запис, натисніть правою кнопкою миші у вікні глосарія (або комбінацію клавіш Ctrl+Shift+G). Відкриється таке діалогове вікно, у якому можна буде додати термін оригіналу, перекладу та, якщо потрібно, коментар:

Зміст файлів глосарія зберігається в оперативній пам’яті, і оновлюється коли проєкт відкривається або перезавантажується. Тож доповнення словника відбувається просто: натисніть Ctrl+Shift+G і введіть новий термін, його переклад та за необхідності коментар. Вміст вікна глосарія буде оновлено.

Місце розташування файлу глосарія, в який будуть додаватися записи, можна вибрати, зайшовши у Проєкт > Властивості... . Підтримуються два розширення: TXT та UTF8.

Зверніть увагу: є інші шляхи та засоби створення простого файлу із записами, розділеними табуляцією. Наприклад, можна використати Notepad++ у Windows, GEdit у Linux або ж ту чи іншу програму для роботи з таблицями. Підійде будь-яка програма, яка працює з UTF-8 (або UTF-16 LE) і може відображати пробільні символи (щоб ви не пропустили потрібних символів TAB).

4. Пріоритетний словник

Результати з пріоритетного словника (типово це ./glossary/glossary.txt) з’являються на першому місці в області «Глосарій».

Записи із пріоритетного та непріоритетного глосаріїв можуть відображатися в області глосарія непослідовно, тож для зручності слова з пріоритетного глосарія виділені напівжирним шрифтом.

5. Типові проблеми, що виникають під час користування глосарієм

Проблема: записи глосарія не відображаються. Можливі причини:

  • Не знайдено файлів глосарія у теці ./glossary.

  • Файл глосарія порожній.

  • Колонки у глосарії не розділені табуляцією.

  • Файл глосарія має неправильне розширення (має бути .utf8 чи .txt).

  • Між термінами сегменту чи тексту, який ви наразі перекладаєте, та записом у глосарії немає ТОЧНОЇ відповідності. Наприклад, в глосарії стоїть однина, а у вашому тексті — множина. Як зазначено вище, для деяких мов глосарій не підтримує флексій.

  • Файл глосарія має неправильне кодування.

  • У виділеному сегменті немає термінів, записаних до глосарія.

  • Можливо, одна чи кілька з вищевказаних проблем вже були виправлені, однак ви не перезавантажили проєкт.

Проблема: у вікні глосарія деякі символи відображуються некоректно

  • ...хоча ті ж символи правильно відображуються у вікні редагування. Проблема полягає в тому, що розширення файлу та його кодування несумісні.



[2] Зауважте, що для мов, для яких не підтримується токенізація, цього може бути замало. Якщо термін стоятиме в сегменті не у називному відмінку, вставлену із глосарія пропозицію потрібно буде провідміняти. Тож, можливо, буде швидше просто надрукувати термін у правильній формі, ніж користуватися глосарієм та відповідними комбінаціями клавіш.