About this board

Previous discussion was archived at User talk:Lucas Werkmeister/Archive 1 on 2017-12-02.

Ivanhercaz (talkcontribs)

Dear Lucas Werkmeister:

I have a notification that I have not read until now about the deletion of an item. This is the diff in which I was mentioned. I don't remember the item nor something about it. I am not discussing you the decision of the deletion, I am just asking which item was. I am bit confused about it, because if I created an item with just Instagram links as references it must have been an old one created by me.

Excuse me the inconvenience of asking you about something happened some months ago. Thanks in advance.

Regards.

Lucas Werkmeister (talkcontribs)

I don’t remember the item either, sorry – you’ll have to ask an admin…

Ivanhercaz (talkcontribs)

Thank you, Lucas! I will do it.

Balû (talkcontribs)

Das Substantiv Spanisch Femininum erzeugt ein Maskulinum. Wenn du mal Zeit hast, bitte korrigieren. Danke.

Lucas Werkmeister (talkcontribs)
Reply to "Wikidata Lexeme Forms - Spanisch"
Discostu (talkcontribs)

I'm unhappy about the removed years. Isn't it possible to integrate fictional calendars into Wikidata somehow?

Lucas Werkmeister (talkcontribs)

Eventually, maybe – but if Wikibase gains support for fictional calendars before some real ones (see e. g. Julian day, Hebrew, Solar Hijri), then some people will probably get angry, and quite rightfully so.

Reply to "Aragorn"
Rosiestep (talkcontribs)

Thanks so much, Lucas, for adding the rest of the works, plus making all the other improvements. Really appreciate it. --~~~~

Reply to "Women Writers in Review"
Theklan (talkcontribs)

Hello Lucas! I added Basque Verb to the forms. Maybe you can take a look and see if everything is ok. Thanks!

Lucas Werkmeister (talkcontribs)

I don’t understand the auxiliary verb (P5401) just before the list of forms – is that supposed to be a statement on the lexeme, or on each form? If yes, with what value?

Theklan (talkcontribs)

with the lexeme. It should change according to th verb. Do you want a list?

Lucas Werkmeister (talkcontribs)

How many possible values are we talking about? If they don’t influence the example sentences, I would exclude them from the template and expect users to add the statement manually afterwards. (So far there are no templates that require users to enter a value for a statement, and I haven’t implemented anything like that – only templates with certain constant statements.)

Theklan (talkcontribs)

exclude it, yes

Lucas Werkmeister (talkcontribs)

Done, please try it out!

Theklan (talkcontribs)

Thanks! It works perfectly!

Summary by Lucas Werkmeister

Vorlagen für Substantive erfolgreich aktiviert

Şêr (talkcontribs)

Hallo Lucas,

ich hoffe dir geht's soweit gut. Könntest du, wenn du irgendwann Zeit hast, wenigstens die Vorlage (Form) für die Substantive aktivieren? siehe: Wikidata:Wikidata Lexeme Forms/Kurdish. Ich würde diese Vorlage für die künftigen und die bereits bestehenden kurdischen Lexeme verwenden wollen. Vielen Dank, Gruß, Şêr

Lucas Werkmeister (talkcontribs)

Sorry, dass ich das so lange hab schlafen lassen… Substantive sind jetzt verfügbar, alles weitere können wir in der alten Diskussion weiter besprechen.

Şêr (talkcontribs)

Es tut mir leid, ich wollte nicht drängen. Vielen lieben Dank. Ich habe versucht die einzelnen Lexems "manuell" nachzutragen. Das war 'ne Qual :)) Ich habe die restlichen Formen auch schlafen lassen. Bin aber dabei mir Gedanken zu machen wegen der Punkte, die du angesprochen hast. Ich bleibe auch dran und werde ich sehr bald bei dir melden deswegen. Lieben Gruß aus Warnemünde, Şêr

Şêr (talkcontribs)

Update to template for Czech Adjectives

12
Adrijaned (talkcontribs)

Hi, I've updated the template for czech adjectives to include information about their comparison specifier. Could you please reflect the changes to the tool of yours?

There is also WIP pattern for czech verbs, but still missing quite a lot of forms and waiting for someone smarter to take a go at it.

Thanks in advance.

Lucas Werkmeister (talkcontribs)
Strepon (talkcontribs)

Hi, thanks a lot, the adjective additions look good for me. However, I am not sure if one adjective template with complete comparison is the best approach - it would be too long and adjectives without comparison could be added in advanced mode only. What do you think about another option with separated templates for positive, comparative and superlative?

Lucas Werkmeister (talkcontribs)

Well, we can always extract a separate positive (Q3482678)-only template out of it afterwards – I assume it only requires dropping the last ⅔ of forms?

Adrijaned (talkcontribs)

Sorry, noticed those talk pages only afterwards.

Yeah, I accept that with those comparatives and superlatives, it goes to quite a crazy amount of words. But are those really that different from the lemmas that they would make sense as separate lexemes? Are those really different words? Ideally, superlatives could get automatically generated from comparatives, after all I'm not aware of any such an atypical adjective where the superlative will differ by anything else but just the prefix "nej-". If that was somehow possible, we could get rid of those superlatives from the form and end up at just something above 100 different forms of adjectives to be manually entered.

Lucas Werkmeister (talkcontribs)
Strepon (talkcontribs)

Yes, I have been used to create adjectives by bulk edits with automatically generated inputs - declination of Czech adjectives is pretty regular to allow it. So I would like to use the same also for comparison and it is now possible for new lexemes only, not if I want to add comparative or superlative to an existing lexeme. This could be solved by the separated templates (for only comparative and superlative), but they should add to existing lexemes as it is in advanced mode (new lexemes for them would be really incorrect, as stated above) - and I don't know if this can be done.

Lucas Werkmeister (talkcontribs)

I just added a feature that should help you update the existing lexemes – you can now specify a lexeme ID in bulk mode, so you could do something like this:

L123|||||||||||new form|new form|etc.

where the number of pipes corresponds to the number of existing forms that should not be re-added. Does that help? (Though that doesn’t add positive (Q3482678) to the existing forms, I’m afraid.)

Strepon (talkcontribs)

This is exactly what I needed, thanks a lot! (Missing "positive" is not a big issue now I think.) The automatic form generation could be also suitable, but - as mentioned below - I encountered the URL length limit.

Adrijaned (talkcontribs)
Lucas Werkmeister (talkcontribs)

Well, the whole point of features like automatic form generation or bulk mode was to not have any logic like this in the tool :/ instead, you’d keep it separate (implemented in any programming language you like, possibly even in Lua reusing whatever modules already exist on Wiktionary) and feed the results into this tool.

Adrijaned (talkcontribs)

Except bulk mode doesn't really provide the opportunity to check the validity of the generated forms beforehand in its matching against the grammmatical properties. Automatic form generation could be used, I just am not being sold on the URL being easily upwards 5000 characters long with czech adjectives. What about the approach proposed in my brand new PR https://github.com/lucaswerkmeister/tool-lexeme-forms/pull/2?

Reply to "Update to template for Czech Adjectives"
Strepon (talkcontribs)

Hi, @Adrijaned prepared a new template for Czech perfective verb and I think that it is ready for publishing. Could you do that? Thank you!

Lucas Werkmeister (talkcontribs)
Reply to "Czech verb template"
Queryzo (talkcontribs)

Hallo Lucas,

das Deutsche Filminstitut ist an mich herangetreten und möchte Wikidata seine Filmdaten in Form eines Kerndatensets zur Verfügung stellen. Wie geht man hierbei am besten vor? Wikidata:Data donation habe ich mir bereits angesehen, ich denke es läuft auf einen Boteinsatz hinaus. Kennst du hierfür einen geeigneten Botbetreiber, der die vorhandenen Items mit den fehlenden Eigenschaften auffüllen bzw. abgeglichende Eigenschaften referenzieren kann? In einem zweiten Schritt wäre wohl auch die Erstellung 10.000er Items notwendig, siehe die beiden Mix'n'match-Kataloge 293 und 294. Theoretisch wäre es auch mit Open Refine möglich, aber das erscheint mir bei der Anzahl der Datensätze und der Vielzahl der zu importierten Daren zu aufwendig. Ich würde mich erstmal um den Datensatz kümmern, als Datenformat ist wohl TSV am geeignetsten, oder? @CennoxX, T.seppelt, Färber: Auch für euch zur Kenntnis.

@Queryzo: Wie sehen den solche Datensätze aus? Wenn z.B. "Film A" und dessen "Filmeditor B" beides neue Objekte sind, wird dann auch per Bot die Property:P1040 in dem Filmobjekt befüllt oder ist das nicht möglich? Oder wäre das nur möglich wenn erst alle Personen und danach die Filmobjekte erstellt werden? --~~~~

Queryzo (talkcontribs)

@Färber: Siehe den Kommentar unten von Lucas, du darfst gern einen eigenen Antwort-Abschnitt erstellen. :-) Zu deiner Frage: Ich stelle es mir so vor, dass erstmal die bestehenden Datensätze mit fehlenden Informationen aufgefüllt werden. Zukünftig sollen dann auch neue Objekte erstellt werden, woraufhin der erste Schritt wiederholt werden kann. Inwiefern ein Bot auch beide Schritte gleichzeitig machen kann, wird im weitern zu klären sein, das wäre natürlich wünschenswert.

Lucas Werkmeister (talkcontribs)

Hast du dir auch Wikidata:Dataset Imports angeschaut? Eine Unterseite davon für diesen Import wäre vermutlich sinnvoll, da können diese und andere Fragen dann zentral beantwortet werden. (Ich bin mir nicht ganz sicher, wie weit diese Seite mit Data donation integriert ist.)

Ich verstehe nicht ganz, was das Problem mit OpenRefine sein soll. Meinst du, es wäre zu aufwendig im Vergleich zur geringen Menge Daten, oder es gibt zu viele Daten um damit mit OpenRefine umzugehen, oder etwas noch anderes?

Mit den verschiedenen Botbetreibern kenne ich mich nicht so sehr aus. OpenRefine müsste aber auch in der Lage sein, die Daten zu importieren, und wo nötig auch neue Items anzulegen.

Färber: Verwende bitte die Antwortfunktion, den Post selbst zu editieren ist bei Structured Discussions wenig sinnvoll :)

Queryzo (talkcontribs)

Ja, solch eine Unterseite würde ich dann anlegen. Ich wollte aber erstmal vorfühlen, was hierfür das richtige Vorgehen ist. Open Refine finde ich bei mehreren 1.000 Datensätzen sehr umständlich. Der Datenabgleich ist langwierig und man verliert schnell den Überblick.

CennoxX (talkcontribs)

@Queryzo: Bin sehr interessiert an dem Datenimport, kannst mich gerne auf dem laufenden halten.

Queryzo (talkcontribs)
Queryzo (talkcontribs)

Hallo Lucas, wie bereits auf der Disk von CennoxX dargestellt, gibt es vom Filminstitut eine neuerliche Anfrage zur Datenspende eines Kernsets von Daten aus dem Filmportal. Ich hoffe, dass wir nun hier einen Schritt weiterkommen.

Reply to "Datenspende vom filmportal.de"
קיין ומוויסנדיק פּרעפֿערענצן (talkcontribs)
Reply to "WikiCon 2019"