Topic on Wikidata talk:Wikidata Lexeme Forms

Şêr (talkcontribs)

Hallo @Lucas Werkmeister (WMDE)/@Lucas Werkmeister, ich habe versucht paar Formulare für Kurdisch (wegen Erstellung Lexemes) anzufertigen. Das Ergebnis hab ick Wikidata:Wikidata Lexeme Forms/Kurdish hier erstellt. Ich muss mir das morgen nochmal in aller Ruhe nochmal anschauen, um Fehler auszuschließen. Wärst du so lieb, und schaust mal bitte drüber, ob es so in Ordnung ist (von der Form her)? :)

Im Kurdischen (besser:Kurmancî) haben wir neben weiblichen und männlichen Wörtern (Geschlechter) auch Wörter, die je nach Verwendung (besser:Person) weiblich oder männlich sein können. Die kurdischen Wörterbücher verwenden jedoch den Begriff "neutral", nicht zu verwechseln mit unserem deutschen "Neutrum". Ich weiß nicht, ob ich hier d. "common gender" verwenden soll? Auf jeden Fall habe ich diese "dritte" Form nicht ins Formular nicht mit reingenommen. Die Verben habe ich erstmal auch außen vor gelassen (Da gibt es Unterschiede bei den Personalpronomen und der Konjugation, je nach dem, ob das Verb transitiv oder intransitiv ist).

Langer Rede kurzer Sinn, könntest du bitte dir die von mir bearbeiteten Formen anschauen, und kurzes Feedback geben.

Vielen lieben Dank


Gruß aus MeckPom

Şêr

Lucas Werkmeister (talkcontribs)

Cool, vielen Dank! Ein paar Fragen habe ich (hoffentlich klingen sie nicht zu ignorant):

  • Diese neutrale Form klingt interessant – werden diese Wörter dann je nach Verwendung unterschiedlich dekliniert (oder konjugiert? ich vergess immer was was ist) und hätten dementsprechend doppelt so viele Formen auf Wikidata?
  • In der Übersetzung für “x forms und y senses” sehe ich „und“ als Übersetzung für Englisch “and” – ist das Kurdisch oder ist da ein deutsches Wort reingerutscht? :) auf Wiktionary und Google Translate finde ich nichts dazu. (Und ist die unterschiedliche Groß- und Kleinschreibung von form und Sense Absicht? Ist form eine Übersetzung und Sense ein Lehnwort?)
  • Gibt es für die zwei Superlative von Adjektiven keine Items, die man noch in die grammatical features stecken könnte, um sie zu unterscheiden? (Außerdem ist es vermutlich ungünstig, dass im Beispiel das Wort am Satzanfang steht – in den echten Lexemen soll es ja mutmaßlich nicht großgeschrieben werden.)

Gruß aus Brandenburg (CCCamp) :)

Şêr (talkcontribs)

Hey :)

@Lucas Werkmeister

danke für die superschnelle und ausführliche Antwort. Ich hoffe, es ist ok für dich, wenn ich erst morgen darauf antworte... Auf den einen Tag kommt es ja nicht an. :) Nee, Alles gut :) Eine angenehme Nacht. Bis dann.


Grüße aus Rostock, Şêr

Şêr (talkcontribs)

Hi Lucas, @Lucas Werkmeister,

zu deiner ersten Frage: Die Formulare sind eigentlich für den am meisten gesprochenen kurdischen Dialekt Kurmancî (Kurmandschi). Das Problem mit "nur Kurmandschi" ist, dass "nur Kurmancî" manchmal zur Irritationen führt. Es ist ja keine selbstständige Sprache, sondern eher nur ein Dialekt des Kurdischen. Es wäre gut/schön wenn d. Item so ausgesehen hätte: Kurdish (Kurmanji), Kurmanjî (Kurdish), damit man einen Bezug zu der Sprache hat, dessen Dialekt Kurmancî ist. Ich weiß ehrlich gesagt nicht, wie man so was realisieren könnte. Auch in den Lehrbüchern, Publikationen wird immer Kurdisch verwendet statt Kurmancî. siehe. Ich weiß nicht, ob für die anderen Dialekte von Lexeme hinzukommen werden. Das mit "kurdische Sprachen" (Wikipediaeintrag) irritiert aber bisschen, da hier eigentlich nur Kurmancî gemeint ist.

zu der zweiten Frage. Ja bei der neutralen Form, werden die Wörter (je nach dem, auf welches Geschlecht man sich bezieht) unterschiedlich dekliniert. Z.B.: das Wort heval (Freund/Freundin). Für heval (männlich) und heval (weiblich) müssten jeweils so viele Formen erstellt werden wie hier Lexeme:L1634. Und Wörter mit "zwei" Geschlechtern sind leider nicht wenig.

 hevalê - die Freundin (oblique case: "Akkusativ") 
 hevalî - den Freund (oblique case : "Akkusativ")

Die oblique case des weiblichen hevalê (die Freundin:Akkusativ) ist zeitgleich auch die Ezafe-Form des männlichen heval. Bsp.: hevalê - die Freundin ("Akkusativ")


Achtung: hevalê min = mein Freund (ê ist auch die Ezafeendung für männlich Sg.!)

zu der dritten Frage: 1. Das mit "und" habe ich korrigiert und durch "û" ersetzt, Kurdisch für und. 2. Das mit Senses habe auch übersetzt. Sense durch "wate" (kurdisch: Sinn/Bedeutung") ersetzt. Im Kurdischen werden die Substantive kleingeschrieben (nur bei Satzanfängen groß). Ich habe das auch korrigiert.


zu der vierten Frage: Also die beiden Superlative sind gleichrangig, wobei ich sagen muss, dass die Form mit "herî + adj" die am meisten verwendete Form ist (95%?). Der Form mit adj+irîn habe ich bisher nur in schriftlichen Werken begegnet. Man wird sogar auch komisch angeguckt (in der Praxis), wenn man die zweite Form verwendet. Diese Form gibt es aber auch im Persischen. siehe. So richtig trennen kann man die nicht. Kann man das nicht als "alternative Form" unterbringen?


zu der fünften Frage: Das mit Ezafe ist kein richtiger Fall. Da werden Attribute an das Nomen gebunden, auf das sich die Attribute beziehen. Im Kurdischen (ich beziehe mich hier auf kurmancî) werden z.B.: die Adjektive NICHT dekliniert; im Deutschen aber ja (siehe KNG-Kongruenz). Da z. B.: die Adjektive nicht dekliniert werden können, müssen sie irgendwie mit dem Bezugs-nomen verbunden werden. Und das geschieht über die sogenannten Ezafe-Endungen. Diese verbinden Nomen und weiteren Attributen eine "Ezafe-Konstruktion") miteinander. Ezafe ist fälleübergreifend (direct case + oblique case + vocative)

Bsp.: heval (männlich)

1. Ezafeendung Singular männlich: -ê > hevalÊ nû - der neue Freund (des neuen Freundes, dem neuen Freund, den neuen Freund, o neuer Freund!)

2. Ezafe-Endung Singular weiblich -a > hevalA nû - die neue Freundin (der neuen Freundin, der neuen Freundin, die neue Freundin, o neue Freundin!)

3. 1 & 2 (Plural) 2. Ezafeendung Singular weiblich -ên > hevalÊN nû - die neuen Freunde/innen (der neuen Freunde/innen, den neuen Freunden/innen, die neue Freunde/innen, o neue Freunde/innen!)

Ich weiß nicht, wie und wo ich das unterbringen soll. (siehe pirtûk - Buch - . Ezafe-Formen dienen nur dazu das Nomen/die Nomen mit den Attributen zu "verbinden".

Ich hoffe, ich konnte dir helfen.

Weitere Fragen beantworte ich gern

Beste Grüße

Lucas Werkmeister (talkcontribs)

Zu 1 – ich habe immer noch den Eindruck, dass Kurmanji (Q36163) das sinnvollere Item für die Sprache der erstellten Lexeme wäre. Beim Titel der Seite und der Lexeme können wir aber ruhig beides unterbringen – vgl. auch Norwegian Nynorsk (und Norwegian Bokmål).

Zu 4 – technisch ist das kein Problem, beide Formen zu erstellen; das Problem ist halt, wenn in den strukturierten Daten nicht steht, welcher Superlativ welcher ist, sind sie nicht so nützlich… ich sollte ja z. B. in Queries wissen, welcher Superlativ der übliche ist.

Zu 5 – okay, wenn Ezafe fälleübergreifend ist, dann macht das so Sinn, denke ich.

Şêr (talkcontribs)

Zu 1 - Kurdisch (Kurmancî) wäre für mich in Ordnung.

Zu 4 - Kann man die zweite Form als Alternative (nachrangig(e)) angeben? Ich bin aber auch kein Sprachwissenschaftler oder irgendein Institut, d. so was festlegen kann/darf. Ich müsste das ggf. bei uns im Wiktionary diskutieren/besprechen - zumal dieses auch davon [betroffen] sein wird.

Zu 5 - Denke ich auch.


Ich muss das mit Verben auch mal vorbereiten. Das wird aber ein sehr langes Formular :) :(

Lucas Werkmeister (talkcontribs)

Zu 1 – okay, erledigt (hoffe ich).

Zu 4 – wir können entweder ein bestimmtes Item in den grammatikalischen Eigenschaften (grammatical features) ablegen oder eine Aussage hinzufügen. Ich weiß nicht, was hier besser passen würde. Gibt es eine bestimmte Bezeichnung für eine der Superlativversionen?

Außerdem sind mir beim Transkribieren der Substantiv-Templates noch zwei Dinge aufgefallen. Vermutlich ist es für die Diskussion am einfachsten, wenn wir die laufende Nummerierung fortführen :)

6: Für den Vokativ hast du second-person singular (Q51929369) bzw. second-person plural (Q51929403) verwendet, anstelle von second person (Q51929049)+singular (Q110786) bzw. second person (Q51929049)+plural (Q146786). Bis jetzt kommt das im Kontext des Tools nur bei English verb vor (third-person singular (Q51929447)); fürs tschechische wurde es diskutiert (die Templates sind aber noch nicht fertig, denke ich). Ich glaube, es könnte in diesem Fall Sinn machen, wollte aber nochmal nachhaken, ob es wirklich so beabsichtigt ist.

7: Im Template fürs Maskulinum teilen sich zwei Formpaare die gleichen Beispiele, Ev [gundek] e. (direct case (Q1751855), singular (Q110786), definite (Q53997851)/indefinite (Q53997857)) und Ez [gundekî] dibînim. (oblique case (Q1233197), singular (Q110786), definite (Q53997851)/indefinite (Q53997857)). Ist das Absicht oder ein Fehler (vielleicht copy+paste)? Bis jetzt sind die Beispiele verschiedener Formen immer unterschiedlich.

Şêr (talkcontribs)

Hallo Lucas,

Zu 1 - einverstanden.

Zu 4 - zu den zwei Steigerungsformen:

  1. A true superlative adjective is made by adding -tirîn to the adjective, and such superlatives precede the nouns they modify:
  2. A second type of superlative is made with herî preceding the adjective. Like -issimo in Italian, herî gives a superlative sense of “really,” e.g. herî girîng means “most important” in the sense of “really important.” Superlatives of compound adjectives like bi quwet ‘powerful’ and past participles used adjectivally like lipaşmayî ‘backward,’ where the addition of -tir would be awkward or impossible, are signaled by herî. (Quelle: Kurmanji Kurdish— A Reference Grammar with Selected Readings, W. M. Thackston, https://sites.fas.harvard.edu/~iranian/Kurmanji/kurmanji_1_grammar.pdf, vgl. https://www.happylanguages.co.uk/lesson/superlative-adjectives-in-italian/ Jetzt weiß ich ehrlich gesagt nicht, ob das im Kurdischen (kurmancî) auch so ähnlich ist. In der kurdischen Fachliteratur bin nirgendwo auf https://de.wiktionary.org/wiki/absoluter_Superlativ und relativen relativen Superlativ gestoßen (bzw. auf einen "Namen").

Zu 6 - Da hast auch Recht. Siehe meine Korrektur:

Zu 7 - siehe ,

Das hier: wäre erst mal (hoffe ich) der letzte Stand nach den Korrekturen.

Nochmals, vielen Dank für deine Bemühungen


Grüße


Şêr (talkcontribs)

PS: Das mit dem "Bulk mode" funktionier für Kurdisch irgendwie nicht. :( Zum Beispiel für das noch nicht existierrend Lexem "das" (weiblich/mê). Ich habe es so eingegeben: das|das|dasê|dasan|dasa|dasên|dasek|dasin|dasekê|dasinan|daseke|dasine|dasekê|dasê|dasino

Kriege folgende Fehlermeldung:

Internal Server Error

The server encountered an internal error and was unable to complete your request. Either the server is overloaded or there is an error in the application.

Lucas Werkmeister (talkcontribs)

Okay, im Server-Log waren zwei Fehler. Der eine war meine Schuld und sollte jetzt behoben sein – ich vermute aber, Lexeme hätten trotzdem angelegt werden sollen, bevor dieser Fehler dann bei der Anzeige möglicher Duplikate ausgelöst wurde. Kannst du mal in deinen Beiträgen nachschauen?

Der andere Fehler ist nicht wirklich ein internes Problem, ich hab mir bis jetzt nur nicht die Mühe gemacht, ihn anständig den Usern anzuzeigen (sorry):

ValueError: n+1 fields but first field is not a lexeme ID

Das ist auch in deinem Beispiel für "das" der Fall: ich zähle dort 15 Formen, das Template kennt aber nur 14, irgendwas passt da nicht zusammen. (Ich sehe gerade, dass die ersten zwei Formen identisch sind, und rate deshalb ins Blaue, was der Grund sein könnte: das Lemma wird nicht extra angegeben, sondern wird automatisch aus der ersten Form übernommen.)

Şêr (talkcontribs)

Jetzt hat es geklappt, im Kurdischen (kurmancî) sind in der ungebeugten Form (entspricht dem deutschen Nominativ) die Singular- und Pluralform identisch.

  1. das (die Sichel)
  2. das (die Sicheln)

siehe: https://ku.wiktionary.org/wiki/das

Ich habe das mal so: gemacht.

---

Kann man die identischen Formen in einer "Zeile" unterbringen.

Folgende Formen sind zum Beispiel identisch (bei weiblichen Wörtern)

a)

- Form 1 (z.B.: das (die Sichel))

- Form 2 (z.B.: das (die Sicheln))

= "Nominativ"

Frage: Eine Form daraus machen?

<singular, plural, direct case, definite> statt 1) singular, direct case, definite und 2) plural, direct case, definite

Filtern wird noch gut klappen?


b)

- Form 3 (dasê (der Sichel, der Sichel, die Sichel))

= "Genitiv, Dativ, Akkusativ"

- Form 13 (dasê ("o Sichel!"))

Frage: Eine Form daraus machen? (Hier würde schlecht gehen)



Folgende Formen sind zum Beispiel identisch (bei männlichen Wörtern)

a)

- Form 1 (z.B.: kevir (der Stein))

- Form 2 (z.B.: kevir (die Steine))

= "Nominativ"

Frage: Eine Form daraus machen?

<singular, plural, direct case, definite> statt 1) singular, direct case, definite und 2) plural, direct case, definite

Filtern wird noch gut klappen?


b)

- Form 9 (kevirekî (eines Steins, einem Stein, einen Stein)

= "Genitiv, Dativ, Akkusativ"

- Form 11 (Konstruktfall - Ezafe) (kevirekî ... - ein/es/em/en ... Stein (ein kleiner Stein, eines kleinen Steines, einem kleinen Stein, einen kleinen Stein)

= "Nominativ, Genitiv, Dativ, Akkusativ"

Frage: Eine Form daraus machen? (Hier würde schlecht gehen)

Versuch:

<singular, Izāfa, indefinite, oblique case>, indefinite statt singular, Izāfa, indefinite singular, oblique case, indefinite

Mir geht es darum, dass man das Ganze auch filtern kann.

....



Şêr (talkcontribs)

Dann hätte man statt 14 Form"zeilen" "nur noch" 12 Formzeilen. Das würde aber bedeuten, dass die eine Vokativform (Singular) ganz oben stehen würde und die andere Form (Plural) ganz unten :D

Şêr (talkcontribs)

Ich habe bei solchen Lexemen [Lexeme:L221049] , dass mehrere ähnliche Formen (die Nase, der Nase) separat geschrieben werden. Von daher hat sich meine Frage erledigt.

Lucas Werkmeister (talkcontribs)

Ich würde auch dazu tendieren, das trotzdem bei mehreren separaten Formen zu lassen. Bei der Vorlage für deutsche Verben habe ich teilweise Formen zusammengefasst, damit sie nicht zu sehr explodiert (hauptsächlich: eine Form für „gesehen“ anstelle von separaten Formen „ich habe gesehen“, „du hast gesehen“, „ich werde gesehen“, „du wirst gesehen haben“, usw.), aber hier ist das nicht nötig, denke ich.

(Wenn ich jetzt noch einmal deine "das"-Zeile mit dem Wiktionary-Link vergleiche, ist vielleicht das drittletzte Feld das Problem? Dieses „dasekê“ sieht so aus, als sei es übriggeblieben – im neunten Feld steht es ja schon einmal.)

Die anderen Änderungen am Template habe ich übernommen, vielen Dank!

Şêr (talkcontribs)

Ja, ich glaube, ja. Gerade bei den weiblichen Wörtern bleibt das "übrig". iich wollte die Reihenfolge der Fälle nicht durcheinander bringen. Es führt aber dazu, dass einige Forme so "übrig bleiben".

Die männliche Variante hat nur -ekî und gilt sowohl für die gebeugte Form und den Konstruktfall. Das mit -ekê hat dann nur eine Funktion.

Übrigens -ek kommt von yek (eins/die Eins).

(bestimmt)

  1. das (die Sichel : Nominativ) (Fall 1)
  2. dasÊ (der Sichel, der Sichel, die Sichel, "o Sichel" : Genitiv, Dativ, Akkusativ, Vokativ) (Fall 2 (Casus obliquus/gebeugte Form) + Fall 3 (Vokativ)

Dann der Konstruktfall dasA (Endung -a bei weiblichen Wörtern)

> dasA min - meine Sichel

(unbestimmt , irgend"ein")

  1. dasEK (eine Sichel) - dasIN (einige Sicheln)
  2. dasEKÊ (dieses -ê siehe bestimmt, für gebeugten Fall, sprich gebeugte Form von "ein") - dasEKÊ - einer Sichel, einer Sichel, eine Sichel (Genitiv, Dativ, Akkusativ) - Vokativ gibt es hier nicht)

Dann der Konstruktfall dasEKE (-eke bei weiblichen Wörtern)

> dasEKE min - eine Sichel von mir.


Es tut mir leid, dass ich dich mit meinen langen Texten nerve. Du hast ja auch viel zu tun. Aber damit es bisschen verständlich wird, habe ich nochmals kurz erläutert. Es ist echt schwer, die Formen den Anforderungen der einzelnen Sprachen oder besser die Sprachen den bestehenden Formen/möglichkeiten anzupassen.

Şêr (talkcontribs)

Jetzt hat das Programm nochmals ein Lexem das erstellt, Lexeme:L221957. Ich wollte nur die Formen aktualisieren. (Ich habe den Bulk-Modus genommen.) Sonst hatte immer gemeckert, wenn d. Lexem bereits existierte.

Dir wünsche ich einen schönen Abend

Gruß

Şêr

Lucas Werkmeister (talkcontribs)

Oh, Mist, offenbar ist die Suche nach Duplikaten hier völlig kaputt. Ich glaube, es liegt an phabricator:T230833, aber ich kann erst einmal einen Workaround hinzufügen.

Lucas Werkmeister (talkcontribs)

Okay, die Duplikate sollten jetzt erkannt werden.

Şêr (talkcontribs)

Es funktioniert perfekt. Danke schön. Ich bin nun bei den Verben bei, speziell bei den intransitiven Lexeme:L61124 (mirin: sterben). Sollen die verneinten Formen auch mit reingenommen werden?

Lucas Werkmeister (talkcontribs)

Hm, würde ich jetzt spontan nicht erwarten – wie sehen sie denn aus?

Şêr (talkcontribs)

Also die Präfixes für Negation sind: na- (für Präsens) und ne- für Vergangenheit. Und einige haben ni- als Präfix der Negation.

Zum Beispiel: kenîn (lachen)

  1. Ez dikenim. - Ich lache
  2. Ez NAkenim. - Ich lache NICHT.

a) -ken- ist der sogenannte Präsensstamm || (vgl.: lach als (Präsens)Verbstamm von lachen, LACHe, LACHst usw.)

b) di- ist das Präfix für Präsens (und Imperfekt)

c) -im (die Personenendung für die erste Person|| (vgl.: lachE (das -e) als Personenendung für die erste Person Singular)


Und das gibt es halt für alle Zeitformen.

Ich habe erst mal nur die Vorlagen für die intransitiven Verben erstellt, da wie die Verben (gerade in den Ieitformen der Vergangenheit) davon abhängt, ob ein Wort intransitiv oder transitiv ist.

Die Zeiten bei transitiven Verben werden anders gebildet ( in den Zeitformen der Vergangenheit, Präsens und Futur 1 funktioniert es ähnlich wie im im Deutschen) , als im Deutschen.

Beispiel: gotin (sagen)

Min got. - Ich habe gesagt. (Präteritum - einmalige Handlung, abgeschlossen)

Min negot. - Ich habe nicht gesagt. (Präteritum - einmalige Handlung, abgeschlossen)

Min ist die deklinierte Form von ez (ich) und bedeutet: mein, mir, mich. Wörtlich bedeutet der erste Satz: Min got. - (Von) mir bzw. /durch) mich wurde es gesagt.

Man bildet es halt passivisch. (https://en.wikipedia.org/wiki/Ergative–absolutive_language). Da weiß ich nicht, wie ich es darstellen soll in den Formen. Da überlege ich noch.

Das Formular für die intransitiven Verben:


Gruß



Lucas Werkmeister (talkcontribs)

Hm, verstehe… wenn die Negation so Teil des Wortes ist, dann wären eigene Formen dafür wohl schon sinnvoll. (Im Deutschen würde ich „ver-lernen“ oder „un-schön“ als separate Lexeme betrachten, aber so wie du es beschreibst, klingt das hier mehr nach Formen als nach Lexemen.) Heißt das, die Anzahl der Formen verdoppelt sich nochmal?

(Nebenbemerkung: die lexical category des Formulars stimmt im Moment nicht ganz, denke ich)

Şêr (talkcontribs)

Ja so ist dat. Die Negation ist ein Teil des Wortes.


Die negierten Formen der Infinitive sind auch davon betroffen. (Das vielleicht als eigene Lexeme?)

Beispiel: kirin (tun) und nekirin (nicht tun).

Ich dachte lexical category hier zum Beispiel bleibt immer "verb". Ist das nicht so? Ich hab's jetzt geändert.

Ja das würde die Formen (leider) verdoppeln. Ich habe erst mal die gängigen Zeitformen genommen. Es gibt noch mehr Zetiformen (Verlaufsformen fehlen, das würde den Rahmen aber sprengen).


Bei transitiven Verben wollte ich bei den baskischen Formen abgucken. Bei den baskischen Verben (von denen wir im Moment ein Paar haben) konnte ich leider keine Formen entdecken. :( Da hat man ja das mit der (Ergativität) auch wie bei uns im Kurdischen.

Lucas Werkmeister (talkcontribs)

verb (Q24905) als lexical category finde ich auch in Ordnung, aber soweit ich sehe stand da vorher halt Kurmanji (Q36163) o_O

Theklan hat kürzlich erst eine Vorlage für baskische Verben angelegt (hier); ist noch unter Diskussion, aber vielleicht kannst du da schon mal nachschauen? (Viele Formen stehen da aber auch nicht.)

Şêr (talkcontribs)

Oh Gott, jetzt sehe ich es. Jetzt aber: Ich schaue mir das an, werde mitverfolgen.

Reply to "Lexeme Forms Kurdish"