Вікідані:Лексикографічні дані/Глосарій

This page is a translated version of the page Wikidata:Lexicographical data/Glossary and the translation is 6% complete.
Outdated translations are marked like this.

  • Форма (form) — це граматична реалізація лексеми. Вона включає словозміни та відмінювання. Наприклад, англійське дієслово «run» стає «running» як present participle і «runs» у 3-й особі однини. Роль кожної форми позначається граматичними ознаками. Форма — це часткова сутність; вона містить ідентифікатор, представлення, невпорядкований (можливо, порожній) список граматичних ознак та список тверджень форми. Форми мають ідентифікатори, що починаються з ідентифікатора лексеми, до якої вони належать, після чого через дефіс ("-") іде "F" і потім натуральне число у десятковій системі числення: наприклад, L123-F7. Це запобігає змішуванню різних форм у різних лексемах.
  • Твердження форми (form statement) — це твердження, що описує форму або її зв'язки з іншими формами або елементами (наприклад, IPA, аудіо вимови).
  • Глоса (gloss) у широкому сенсі є природним визначенням смислу (див. gloss (Q1132324)). Глоса — це непорожній невпорядкований набір пар рядок/мова глоси, кожна з пар або частина рядка також може називатися Глоса (у вузькому сенсі). Вона надає визначення цілковито різними мовами. Наприклад, французьке слово може мати глосу французькою мовою на додаток до глоси німецькою.
  • Мова глоси (gloss language або language of gloss) представлена як код мови.
  • Граматична ознака (grammatical feature) визначає, за яких умов або в якій синтаксичній ролі використовується ця форма. Ознаки представлені у вигляді невпорядкованого (можливо порожнього) набору елементів.
  • Мова (language) — це термін, що застосовується по-різному в різних частинах лексикографічних даних; див. мова глоси та мова лексеми.
  • Мовний код (language code) — це код, який призначає літери або цифри як ідентифікатори або класифікатори мов (див. language identifier (Q2092812)). Дійсні коди мов у лексикографічних даних здебільшого є підмножиною дійсних (BCP 47) IETF language tag (Q1059900), але надмножиною мітки мов. Він складається з мови мітки та необов'язкового підтега для приватного використання у форматі -x-Q######.
  • Лема (lemma) в широкому значенні — канонічна, словникова або цитатна форма слова (див. lemma (Q18514)). Наприклад, "бігти", "біжить", "біг" і "біжить" є формами однієї і тієї ж лексеми, причому "бігти" є лемою. Леми — це не простий рядок, а непорожня невпорядкована множина пар рядок/правописний варіант, кожна з яких або її частина також може називатися лемою (у вузькому розумінні). Таким чином, лема може включати слова в декількох орфографіях. Наприклад, лема для англійського іменника color включатиме "colour" для британської англійської мови, а також "color" для американської англійської мови.
  • Лексема (lexeme) — це лексичний елемент мови, такий як слово або фраза (див. lexeme (Q111352)). Він складається з набору форм, утворених з одного слова однією мовою, та слів у будь-якому варіанті їхньої орфографії. Наприклад, англійські іменники "color", "colour" та їхні множинні форми "colors" та "colours" вважаються однією лексемою, а англійський іменник "color" та дієслово "color" — двома лексемами. Кожна лексема є сутністю (entity) і зберігається на сторінці (page) в просторі назв "Lexeme"; вона включає в себе ідентифікатор із префіксом (наприклад, L123), лему, мову лексеми, лексичну категорію, список тверджень лексеми, список форм та список смислів.
  • Мова лексеми (lexeme language або language of lexeme) вказується як елемент.
  • Твердження лексеми (lexeme statement) — твердження, не специфічне для Форми чи Смислу (наприклад, похідна від граматичного роду чи синтаксичної функції)
  • Лексична категорія (lexical category) — це класифікація лексеми на категорії, які мають подібні граматичні властивості (див. part of speech (Q82042)), також відомі як частина мови в граматиці. Він позначається елемент, наприклад, noun (Q1084) та verb (Q24905).
  • Представлення (representation) у широкому розумінні — це письмова форма форми. Як і леми, представлення є не простим рядком, а непорожньою невпорядкованою множиною пар рядок/правописний варіант, кожну з яких або її рядкову частину також можна назвати представленням (у вузькому розумінні).
  • Смисл (sense) — це різні значення лексеми, які вона може представляти у тексті. Смисл — це часткова сутність (subentity); він містить ідентифікатор, глосу та список тверджень смислу. Смисли мають ідентифікатори, що починаються з ідентифікатора лексеми, до якої вони належать, після нього через дефіс ("-") іде "S", за яким слідує натуральне число в десятковій системі числення: наприклад L123-S4.
  • Твердження смислу (sense statement) — це твердження, що описує смисл і його зв'язки з іншими смислами й елементами (наприклад, переклади, синоніми, антоніми, конотації).
  • Варіант правопису (spelling variant) це специфічне написання лема або представлення, наприклад, британська англійська (en-gb) та американська англійська (en-us) є різними варіантами написання. Варіант написання представляється у вигляді мовного коду.
  • Часткова сутність (subentity) — це форма і смисл. Вони є особливим видом сутності і можуть використовуватися у твердженнях, але вони не мають своєї сторінки; натомість вся інформація про часткову сутність зберігається на сторінці лексеми, до якої належить часткова сутність. Кожна часткова сутність функціонально залежить від однієї лексеми.