מונחון מילונאות בוויקינתונים

This page is a translated version of the page Wikidata:Lexicographical data/Glossary and the translation is 50% complete.
Outdated translations are marked like this.

  • צורה (form): המימוש הדקדוקי של יחידה מילונית. זה כולל נטיות. למשל, לפועל "רץ" ישנה הצורה "רצנו" בגוף ראשון רבים, בזמן עבר, בדרך החיווי, באופן פעיל. תפקידה של כל צורה מבוטא דרך תכונות דקדוקיות. צורה היא תת־ישות. היא כוללת מזהה (ID), ייצוג, רשימה לא ממוינת (ואולי ריקה) של תכונות דקדוקיות ורשימה של קביעות צורה. מזהה הצורה מתחיל במזהה היחידה המילונית שהיא שייכת אליה, ולאחריו סימן מינוס (-), האות F ומספר טבעי סודר, למשל: L123-F7. כך נמנע בלבול בין צורות דומות ביחידות מילוניות שונות.
  • קביעת צורה (Form statement): קביעה שמתארת את הצורה הלשונית או את יחסיה לצורות או לפריטים אחרים (כגון תעתיק באלפבית הפונטי או הקלטת שמע של הגיית הצורה).
  • פירוש (gloss): הגדרה בלשון טבעית של משמעות מסוימת (ר' gloss (Q1132324)). פירוש הוא קבוצה לא ריקה ולא ממוינת של צמדים, שכן אחד מהם מכיל מחרוזת ושפת פירוש. לכל הצמד ולחלק המחרוזת אפשר לקרוא פירוש. הוא מספק הגדרוה בשפות מגוונות. למשל, למילה צרפתית יכול להיות פירוש בצרפתית, בנוסף לפירוש בגרמנית.
  • שפת הפירוש (gloss language) מיוצגת כקוד שפה.
  • תכונה דקדוקית (Grammatical feature): הגדרה של תנאים או של תפקידים תחביריים שצורה משמשת בהם. תכונות דקדוקיות מבוטאות כקבוצה לא ממוינת (ואולי ריקה) של פריטים.
  • שפה (language): ר' שפת הפירוש ושפת היחידה המילונית.
  • קוד שפה (language code): צירוף אותיות או ספרות שמשמש מזהה או מסַווג של שפות (ר' language identifier (Q2092812)). קודי השפה התקינים בנתונים המילוניים הם תת־קבוצה תגי שפה לפי תקן BCP 47 (ר' IETF language tag (Q1059900)) וקבוצת־על של שפות תוויות. יכול להיות תת־תג בצורת -x-Q######.
  • שם ערך מילוני: הצורה המילונית, התקנית, או המצוטטת של יחידה מילונית (ר' lemma (Q18514)). למשל "אכל", "אוכלת", "אכלו", ו"לאכול" הן צורות של אותה [[lemma (Q18514)|היחידה המילונית]], ו"אכל" הוא שם הערך המילוני, כמקובל בעברית. השם המילוני אינו מחרוזת תווים פשוטה, אלא קבוצה לא ריקה ולא ממוינת של צמדים שכוללים מחרוזת ותקן כתיב. כל אחד מהצמדים האלה יכול להיקרא שם ערך מילוני. לפיכך, יכול שם מילוני להופיע ביותר מצורת כתיב אחת. למשל, שם התואר "אדום" יכול להופיע בכתיב המלא חסר הניקוד, "אדום", וגם בכתיב המנוקד "אָדֹם".
  • לקסמה היא יחידה לשונית בעלת משמעות בשפה, ויכולה להיות מלה בודדת, צירוף, או מוספית (ראו lexeme (Q111352)). בוויקינתונים, לקסמה מכילה את כל הצורות הדקדוקיות של היחידה הלשונית בשפה נתונה, את המשמעויות (ההוראות) שלה, ומידע נוסף, כגון מקור אטימולוגי, דרכי הגייה, ועוד. למשל, הפועל העברי "רץ", על צורותיו "רצתי", "רצנו", "נרוץ", "רוצי", וכן הלאה, הוא לקסמה אחת, אבל שם העצם העברי "רץ" (במובן שליח, או במובן כלי השחמט) הוא לקסמה נפרדת. כל לקסמה היא ישות של ויקינתונים, אשר שמורה בדף משלה במרחב הלקסמות (Lexeme:); הלקסמה מכילה מזהה שמתחיל באות L (ולא Q כמו פריטי ויקינתונים), שם מילוני, שפת הלקסמה, סוג דקדוקי, רשימת הצהרות לקסמה, רשימת צורות, ורשימת מובנים.
  • שפת הלקסמה היא השפה שאליה שייכת לקסמה מסוימת, והיא מבוטאת באמצעות פריט הוויקינתונים המתאר את השפה. למשל, עברית היא Hebrew (Q9288).
  • הצהרת לקסמה היא הצהרה שאינה נסובה על צורה או מובן מסוימים, אלא נכונה לגבי הלקסמה כולה, כגון "מין דקדוקי".
  • סוג דקדוקי הוא סיווג של לקסמות לקבוצות בעלות מאפיינים דקדוקיים משותפים (ראו part of speech (Q82042)), שנקראים גם "חלקי הדיבר". הסוג מבוטא כפריט ויקינתונים, כגון noun (Q1084) או verb (Q24905).
  • ייצוג (Representation) במובן הרחב הוא ההופעה הכתובה של צורה. כמו שמות מילוניים, הייצוג אינו מחרוזת תווים פשוטה, אלא קבוצה בת צמד אחד או יותר של מחרוזת ושל סוג כתיב; כל אחד מהצמדים הללו יכול להיקרא ייצוג במובן הצר.
  • מובן הוא משמעות – הוראה – אשר לקסמה עשוייה לבטא בטקסט מסוים. המובן הוא תת־ישות; הוא מכיל מזהה (ID), ביאור, ורשימת הצהרות מובן. מזהי מובנים מתחילים במזהה הלקסמה שאליה הם שייכים, ולאחריו מינוס (-), התו "S" (מלשון Sense, מובן באנגלית), ולאחריו מספר טבעי עשרוני. לדוגמה: L123-S4
  • הצהרת מובן היא הצהרה שמתארת מובן מסוים, ואת הקשרים שלו למובנים אחרים ולפריטי ויקינתונים (כגון מלים נרדפות, הפכים, מונחים מקבילים בשפות אחרות).
  • סוג כתיב הוא זיהוי הכתיב המסוים של שם מילוני או של ייצוג. למשל, איות בריטי או אמריקאי של מילה אנגלית, או כתיב חסר לעומת כתיב מלא בעברית. סוג הכתיב מבוטא כקוד שפה.
  • תת־ישות היא רכיב של לקסמה שלמה: צורה או מובן. היא סוג מיוחד של ישות, ואפשר להפנות אליה בערכים של הצהרות אחרות, אבל אין לה דף משלה; כל המידע הקשור בתת־הישות שמור בדף של הלקסמה שאליה היא שייכת. כל תת־ישות שייכת רק ללקסמה אחת.