About this board

Previous discussion was archived at User talk:Lucas Werkmeister/Archive 1 on 2017-12-02.

Rosiestep (talkcontribs)

Thanks so much, Lucas, for adding the rest of the works, plus making all the other improvements. Really appreciate it. --~~~~

Reply to "Women Writers in Review"
Theklan (talkcontribs)

Hello Lucas! I added Basque Verb to the forms. Maybe you can take a look and see if everything is ok. Thanks!

Lucas Werkmeister (talkcontribs)

I don’t understand the auxiliary verb (P5401) just before the list of forms – is that supposed to be a statement on the lexeme, or on each form? If yes, with what value?

Theklan (talkcontribs)

with the lexeme. It should change according to th verb. Do you want a list?

Lucas Werkmeister (talkcontribs)

How many possible values are we talking about? If they don’t influence the example sentences, I would exclude them from the template and expect users to add the statement manually afterwards. (So far there are no templates that require users to enter a value for a statement, and I haven’t implemented anything like that – only templates with certain constant statements.)

Theklan (talkcontribs)

exclude it, yes

Lucas Werkmeister (talkcontribs)

Done, please try it out!

Theklan (talkcontribs)

Thanks! It works perfectly!

Summary by Lucas Werkmeister

Vorlagen für Substantive erfolgreich aktiviert

Şêr (talkcontribs)

Hallo Lucas,

ich hoffe dir geht's soweit gut. Könntest du, wenn du irgendwann Zeit hast, wenigstens die Vorlage (Form) für die Substantive aktivieren? siehe: Wikidata:Wikidata Lexeme Forms/Kurdish. Ich würde diese Vorlage für die künftigen und die bereits bestehenden kurdischen Lexeme verwenden wollen. Vielen Dank, Gruß, Şêr

Lucas Werkmeister (talkcontribs)

Sorry, dass ich das so lange hab schlafen lassen… Substantive sind jetzt verfügbar, alles weitere können wir in der alten Diskussion weiter besprechen.

Şêr (talkcontribs)

Es tut mir leid, ich wollte nicht drängen. Vielen lieben Dank. Ich habe versucht die einzelnen Lexems "manuell" nachzutragen. Das war 'ne Qual :)) Ich habe die restlichen Formen auch schlafen lassen. Bin aber dabei mir Gedanken zu machen wegen der Punkte, die du angesprochen hast. Ich bleibe auch dran und werde ich sehr bald bei dir melden deswegen. Lieben Gruß aus Warnemünde, Şêr

Şêr (talkcontribs)

Update to template for Czech Adjectives

12
Adrijaned (talkcontribs)

Hi, I've updated the template for czech adjectives to include information about their comparison specifier. Could you please reflect the changes to the tool of yours?

There is also WIP pattern for czech verbs, but still missing quite a lot of forms and waiting for someone smarter to take a go at it.

Thanks in advance.

Lucas Werkmeister (talkcontribs)
Strepon (talkcontribs)

Hi, thanks a lot, the adjective additions look good for me. However, I am not sure if one adjective template with complete comparison is the best approach - it would be too long and adjectives without comparison could be added in advanced mode only. What do you think about another option with separated templates for positive, comparative and superlative?

Lucas Werkmeister (talkcontribs)

Well, we can always extract a separate positive (Q3482678)-only template out of it afterwards – I assume it only requires dropping the last ⅔ of forms?

Adrijaned (talkcontribs)

Sorry, noticed those talk pages only afterwards.

Yeah, I accept that with those comparatives and superlatives, it goes to quite a crazy amount of words. But are those really that different from the lemmas that they would make sense as separate lexemes? Are those really different words? Ideally, superlatives could get automatically generated from comparatives, after all I'm not aware of any such an atypical adjective where the superlative will differ by anything else but just the prefix "nej-". If that was somehow possible, we could get rid of those superlatives from the form and end up at just something above 100 different forms of adjectives to be manually entered.

Lucas Werkmeister (talkcontribs)
Strepon (talkcontribs)

Yes, I have been used to create adjectives by bulk edits with automatically generated inputs - declination of Czech adjectives is pretty regular to allow it. So I would like to use the same also for comparison and it is now possible for new lexemes only, not if I want to add comparative or superlative to an existing lexeme. This could be solved by the separated templates (for only comparative and superlative), but they should add to existing lexemes as it is in advanced mode (new lexemes for them would be really incorrect, as stated above) - and I don't know if this can be done.

Lucas Werkmeister (talkcontribs)

I just added a feature that should help you update the existing lexemes – you can now specify a lexeme ID in bulk mode, so you could do something like this:

L123|||||||||||new form|new form|etc.

where the number of pipes corresponds to the number of existing forms that should not be re-added. Does that help? (Though that doesn’t add positive (Q3482678) to the existing forms, I’m afraid.)

Strepon (talkcontribs)

This is exactly what I needed, thanks a lot! (Missing "positive" is not a big issue now I think.) The automatic form generation could be also suitable, but - as mentioned below - I encountered the URL length limit.

Adrijaned (talkcontribs)
Lucas Werkmeister (talkcontribs)

Well, the whole point of features like automatic form generation or bulk mode was to not have any logic like this in the tool :/ instead, you’d keep it separate (implemented in any programming language you like, possibly even in Lua reusing whatever modules already exist on Wiktionary) and feed the results into this tool.

Adrijaned (talkcontribs)

Except bulk mode doesn't really provide the opportunity to check the validity of the generated forms beforehand in its matching against the grammmatical properties. Automatic form generation could be used, I just am not being sold on the URL being easily upwards 5000 characters long with czech adjectives. What about the approach proposed in my brand new PR https://github.com/lucaswerkmeister/tool-lexeme-forms/pull/2?

Reply to "Update to template for Czech Adjectives"
Strepon (talkcontribs)

Hi, @Adrijaned prepared a new template for Czech perfective verb and I think that it is ready for publishing. Could you do that? Thank you!

Lucas Werkmeister (talkcontribs)
Reply to "Czech verb template"
Queryzo (talkcontribs)

Hallo Lucas,

das Deutsche Filminstitut ist an mich herangetreten und möchte Wikidata seine Filmdaten in Form eines Kerndatensets zur Verfügung stellen. Wie geht man hierbei am besten vor? Wikidata:Data donation habe ich mir bereits angesehen, ich denke es läuft auf einen Boteinsatz hinaus. Kennst du hierfür einen geeigneten Botbetreiber, der die vorhandenen Items mit den fehlenden Eigenschaften auffüllen bzw. abgeglichende Eigenschaften referenzieren kann? In einem zweiten Schritt wäre wohl auch die Erstellung 10.000er Items notwendig, siehe die beiden Mix'n'match-Kataloge 293 und 294. Theoretisch wäre es auch mit Open Refine möglich, aber das erscheint mir bei der Anzahl der Datensätze und der Vielzahl der zu importierten Daren zu aufwendig. Ich würde mich erstmal um den Datensatz kümmern, als Datenformat ist wohl TSV am geeignetsten, oder? @CennoxX, T.seppelt, Färber: Auch für euch zur Kenntnis.

@Queryzo: Wie sehen den solche Datensätze aus? Wenn z.B. "Film A" und dessen "Filmeditor B" beides neue Objekte sind, wird dann auch per Bot die Property:P1040 in dem Filmobjekt befüllt oder ist das nicht möglich? Oder wäre das nur möglich wenn erst alle Personen und danach die Filmobjekte erstellt werden? --~~~~

Queryzo (talkcontribs)

@Färber: Siehe den Kommentar unten von Lucas, du darfst gern einen eigenen Antwort-Abschnitt erstellen. :-) Zu deiner Frage: Ich stelle es mir so vor, dass erstmal die bestehenden Datensätze mit fehlenden Informationen aufgefüllt werden. Zukünftig sollen dann auch neue Objekte erstellt werden, woraufhin der erste Schritt wiederholt werden kann. Inwiefern ein Bot auch beide Schritte gleichzeitig machen kann, wird im weitern zu klären sein, das wäre natürlich wünschenswert.

Lucas Werkmeister (talkcontribs)

Hast du dir auch Wikidata:Dataset Imports angeschaut? Eine Unterseite davon für diesen Import wäre vermutlich sinnvoll, da können diese und andere Fragen dann zentral beantwortet werden. (Ich bin mir nicht ganz sicher, wie weit diese Seite mit Data donation integriert ist.)

Ich verstehe nicht ganz, was das Problem mit OpenRefine sein soll. Meinst du, es wäre zu aufwendig im Vergleich zur geringen Menge Daten, oder es gibt zu viele Daten um damit mit OpenRefine umzugehen, oder etwas noch anderes?

Mit den verschiedenen Botbetreibern kenne ich mich nicht so sehr aus. OpenRefine müsste aber auch in der Lage sein, die Daten zu importieren, und wo nötig auch neue Items anzulegen.

Färber: Verwende bitte die Antwortfunktion, den Post selbst zu editieren ist bei Structured Discussions wenig sinnvoll :)

Queryzo (talkcontribs)

Ja, solch eine Unterseite würde ich dann anlegen. Ich wollte aber erstmal vorfühlen, was hierfür das richtige Vorgehen ist. Open Refine finde ich bei mehreren 1.000 Datensätzen sehr umständlich. Der Datenabgleich ist langwierig und man verliert schnell den Überblick.

CennoxX (talkcontribs)

@Queryzo: Bin sehr interessiert an dem Datenimport, kannst mich gerne auf dem laufenden halten.

Queryzo (talkcontribs)
Queryzo (talkcontribs)

Hallo Lucas, wie bereits auf der Disk von CennoxX dargestellt, gibt es vom Filminstitut eine neuerliche Anfrage zur Datenspende eines Kernsets von Daten aus dem Filmportal. Ich hoffe, dass wir nun hier einen Schritt weiterkommen.

Reply to "Datenspende vom filmportal.de"
קיין ומוויסנדיק פּרעפֿערענצן (talkcontribs)
Reply to "WikiCon 2019"
Hogü-456 (talkcontribs)

Hallo Lucas,

ich beschäftige mich gerade mit Abfragen und dem SPARQL-QueryService. Vielleicht ist dieser Vorschlag etwas, dass mehr zu deiner Arbeit bei Wikimedia Deutschland zählt, da ich aber nicht sicher bin, frage ich dich hier über deinen Privataccount. Ich habe mich mit Abfragen beschäftigt und denke, dass man, wenn ein paar Beispielabfragen zur Verfügung stehen, man viel erreicht hat und das Abfragen erleichtert wird. Was man braucht ist eine Abfrage, die nach Eigenschaften und Qualifikatoren sucht und sich beides anzeigen lässt. Es gibt von Hay das Tool VizQuery, das ich gut und einfach zu bedienen finde. Wenn man dieses erweitert, sodass man damit nach Qualifikatoren suchen kann und sich diese anzeigen lassen kann, dann erleichtert das das Erstellen von Abfragen erheblich. Kannst du bitte einmal eine Beispielabfrage erstellen, die nach Eigenschaften und Qualifikatoren sucht und sich diese anzeigen lässt und die so aufgebaut ist, dass man sie für einen solchen QueryBuilder, wie den von Hay benutzen kann. Ich denke das würde vielen Nutzern helfen.

Lucas Werkmeister (talkcontribs)

Naja, ich kann VizQuery eine Query mit Qualifiern geben (Beispiel), aber es scheint damit nicht so gut klarzukommen. Das müsste letztlich von Hays Seite implementiert werden.

Reply to "Sammlung von Beispielabfragen"

Amtsinhaber zu einem gegebenen Zeitpunkt

2
Hogü-456 (talkcontribs)

Hallo Lucas,

wie muss man die Abfrage schreiben, wenn man wissen möchte wer zum 31. Dezember 2010 Präsident des Deutschen Statistischen Bundesamtes war und denkst du, dass sich so etwas durch natürlichsprachige Fragen abbilden lässt. Also, dass man fragen kann, Wer war am 31. Dezember 2010 Präsident des Statistischen Bundesamtes? und darauf eine Antwort bekommt. Ich finde die Möglichkeit Antworten auf Fragen zu bekommen nützlich und denke, dass wenn die Frage vorgegeben ist, es relativ einfach umsetzbar ist und man mit ein paar vordefinierten Fragen in einem bestimmten Bereich relativ viele Daten herausbekommen kann.

TweetsFactsAndQueries (talkcontribs)

Die Abfrage könnte ungefähr so aussehen:

SELECT ?item ?itemLabel WHERE {
  BIND("2010-12-31"^^xsd:dateTime AS ?date)
  wd:Q764739 p:P1037 ?statement.
  ?statement ps:P1037 ?item.
  OPTIONAL { ?statement pq:P580 ?start_. }
  BIND(COALESCE(?start_, "1900-01-01"^^xsd:dateTime) AS ?start)
  OPTIONAL { ?statement pq:P582 ?end_. }
  BIND(COALESCE(?end_, NOW()) AS ?end)
  FILTER(?start <= ?date && ?date <= ?end)
  SERVICE wikibase:label { bd:serviceParam wikibase:language "[AUTO_LANGUAGE],en,de". }
}

Try it!

Reply to "Amtsinhaber zu einem gegebenen Zeitpunkt"
Joalpe (talkcontribs)

Hi Lucas! How are you? I was wondering if it is possible to add via QS senses on already-created lexemes. If yes, how is it written for QS? Thanks

Lucas Werkmeister (talkcontribs)

I’m afraid it’s not possible at the moment. It is possible via the “advanced mode” of Wikidata Lexeme Forms, though ☺

Joalpe (talkcontribs)

Oh no! :( We've done some editing on lexemes today, from Brazil, and it is a bit of a pain to create the items manually. I had found this batch, and I thought it might be an automated means of editing senses. Anyway, we've started working on the Portuguese version of Wikidata Lexeme, so we might have a way to do automated edit when it's ready. Thanks!

Lucas Werkmeister (talkcontribs)

That batch only edits the statements of existing lexemes/senses/forms, which is possible, but there’s no way to create new ones or to edit the lexeme-specific features (lemmas, lexical categories, etc.).

I’ll take a look at the Portuguese templates as soon as I can, thanks! However, it might not happen before next weekend (beginning of June), this one’s very busy for me :/

Reply to "Quickstatements --> sense"