Wikidata:Forum

Wikidata-Forum
Hier kann alles zu Wikidata besprochen werden: das Projekt, seine Regeln, technische Probleme usw.
Weitere Diskussionen und Ankündigungen gibt es insbesondere im englischsprachigen Project chat.
Bitte wirf auch einen Blick auf die häufig gestellten Fragen, um zu sehen, ob deine Frage bereits beantwortet wurde.
Bitte benutze die Vorlagen {{Q}} oder {{P}}, wenn du ein Datenobjekt beziehungsweise eine Eigenschaft zum ersten mal erwähnst.
Löschanträge können hier gestellt werden. Eine Anleitung zum Zusammenlegen von Datenobjekten gibt es hier.
Wikidata de Telegramgruppe
Auf dieser Seite werden alte Diskussionen nach 10 Tagen archiviert. Eine Übersicht aller Archive befindet sich hier. Das aktuelle Archiv befindet sich unter Wikidata:Forum/Archiv/2021/03.

Liste country calling code (P474) (Analog zum Anhang der ITU-T Richtlinie E.164 (Q1273341))Edit

Hallo, dies ist meine erste Woche in Wikidata und ich bin schon sehr begeistert von dem was ich bisher gefunden habe. Danke.
Ich habe über eine SPARQL-Abfrage query.wikidata.org alle int. Vorwahlen abgefragt und festgestellt, dass ich diese Liste wohl nicht ohne weitere Bearbeitung verwenden kann.
Zum einen gibt es doppelte Einträge (z.B. Union State (Q166110) und Russia (Q159)) und auch vermutlich falsche Einträge (z.B. Shree Kumari Secondary School (Q83482529) und zum anderen fehlen mir Quellenangaben.
Mein erster Gedanke war alle Einträge zu korrigieren und mit Quellenangaben zu versehen bis am Ende eine vollständige Liste übrig bleibt. Ich vermute nur, dass dies nicht möglich/sinnvoll ist, da es auch Länder/Regionen mit unklarer bzw. nicht anerkannter oder auch historischer Zuordnung (z.B. West Germany (Q713750)) gibt.
Mein zweiter Versuch war, alle offiziellen int. Vorwahlen an die ITU-T Richtlinie E.164 (Q1273341) zu hängen (mit has parts of the class (P2670)) - leider habe ich noch keine gute Idee wie ich das am besten Abbilde und später Abfrage.
Evtl. kann mir hierbei jemand helfen. Mein Wunsch wäre es eine Lösung zu finden, mit der ich (gerne auch mit wiederkehrender Pflege) alle offiziellen (mit Verweis auf E.164) und technisch funktionierenden (mit Verweis auf sonstige Quellen) internationalen Vorwahlen abfragen kann (am besten mit Angabe der jeweiligen Quelle). Ich freue mich auf Eure Unterstützung und möchte gerne auch ein Teil von Wikidata werden.  – The preceding unsigned comment was added by Widomattern (talk • contribs) at 22:08, 31 January 2020‎ (UTC).

Löschen von described at URL (P973) gegen IdentifikatorEdit

User:Thierry Caro tauscht Referenzen gegen zB Museumsidentifikatoren aus. Ich wäre da leidenschaftslos, wenn nicht damit die Beschreibung auf den Dateibeschreibungen verschwindet. Bei Atlas/Louvre, joconde, rkd ist auch die Nutzung von Identifikatoren sichtbar. Ich weiß leider nicht, wie man letzteres bewirkt. https://www.wikidata.org/w/index.php?title=Q22083984&type=revision&diff=1341970224&oldid=1341669151&diffmode=source

Ich hab es revertiert, deshalb ist die Info sichtbar--Oursana (talk) 19:38, 23 February 2021 (UTC)

@Oursana: Bei den Änderungen bin ich bei Thierry Caro und würde die Angabe als externer Identifikator mit geeigneter Eigenschaft bevorzugen. Eine zusätzliche Angabe mit described at URL (P973) fände ich dann redundant. Mir ist nicht ganz klar, was du mit Beschreibung bzw. Dateibeschreibung meinst. Beziehst du dich auf die Infoboxen in Wikimedia Commons? --Nw520 (talk) 20:16, 23 February 2021 (UTC)
Ich finde die Identifikator-Angabe auch schöner. Solange diese aber nicht in der Dateibeschriebung der zugehörigen Bilddatei auf commons erscheint, ist IMHO described at URL (P973) nicht nur nicht überflüssig sondern erforderlich, denn insoweit geht die Info auf commons vor, die man ja dort auch ohne commons vornehmen könnte. Aber das Neben- und Gegeneinander ist nicht Sinn der Sache, dann können wir uns wikdata direkt schenken. In dem Beispiel erscheint auf commons die erste Referenz wie von dem Bearbeitungszeichen gezeigt durch Verwendung von described at URL (P973). Ohne meinen Revert stünde dort nichts, weil die Eingabe mittels Identifikator auf wikidata nicht zu einer Infoansicht auf commons führt. Das macht in meinen Augen auch den Tausch von Identifikator-Eingabe statt Verwendung von described at URL (P973) unzulässig, weil dadurch wesenliche Informationen auf commons gelöscht werden. Deshalb mein Revert.Hier ein weiteres Bespiel, bei dem ich described at URL (P973) hinzugefügt habe. Hier gibt es nun sehr viele Referenzen, SMB-digital ID (P8923) so wie oben National Museum in Warsaw ID (P9061) zeigt keine Info auf commons an, dies erfolgt nur über described at URL (P973), womit die Informationseingabe mittels dieser Eigenschaft zu bevorzugen wäre. In meinem letzten Beispiel des Jungbrunnes gibt es Bildindex der Kunst und Architektur ID (P2092), hier wie beim französischen joconde, bei der atlas Datenbank des Louvre und beim nl RKD wir die Info auf commons angezeigt. Dann macht der Identifikator ausnahmslos Sinn. Bei allen anderen Identifikatoren wird er deshalb immer zusätzlich über described at URL (P973) eingegeben.--Oursana (talk) 23:01, 24 February 2021 (UTC)
@Oursana: Mir scheint, als sollte das lieber im Commons-Modul hinzugefügt werden. Würde man deinen Gedanken konsequent weiterführen, hätten wir wahlweise gar keine externen Identifikatoren mehr oder alle zusätzlich als described at URL (P973) eingetragen. In Commons ist, soweit ich sehe, das Modul Wikidata art (Variable commons_templates_for_database, derzeit Zeile 825) für das Formatieren von Externen Identifikatoren verantwortlich. Ich würde vorschlagen, dass du anregst, dass dort die gewünschten Identifikatoren mit aufgenommen werden. --Nw520 (talk) 00:26, 25 February 2021 (UTC)
Ja das ist eine gute Idee hier Beispiel für auf commons erscheinende Identifikatoren. Das ist gerade der Sinn von Structured data--Oursana (talk) 16:29, 25 February 2021 (UTC)

Dopplung?Edit

hi, Franz Stuhlmann (Q107750) und Franz Ludwig Stuhlmann (Q21395122) scheinen sich auf die gleiche Person zu beziehen. --Muscari (talk) 23:25, 2 March 2021 (UTC)

Das dürfte ohne Zweifel so sein, deswegen habe ich dir beiden Datenobjekte zusammengefügt. --Gymnicus (talk) 17:28, 3 March 2021 (UTC)
dankeschön! --Muscari (talk) 23:53, 3 March 2021 (UTC)

NormdatenEdit

Hallo zusammen! Ich verknüpfe oft Objekte in Wikipedia, VIAF und Wikidata mit der GND (mein letztes Opfer: Q1965921). Gerade bei Ortsteilen gibt es für den gleichen Ortsteil in der GND mehrere Einträge, je nachdem, zu welcher Gemeinde/Stadt der Ortsteil schon gehört hat. Jeder dieser Einträge befindet sich für gewöhnlich in VIAF. In Wikipedia und Wikidata gibt es jeweils nur einen Eintrag für den Ortsteil. Für mich stellt sich daher die Frage: Verknüpfe ich in Wikidata zu jedem Ortsteil nur die GND- und VIAF-Nummer vom aktuellsten Eintrag für einen Ortsteil oder alle? (Falls es zufällig jemand weiß: in Wikipedia soll jeweils nur der aktuellste eingetragen werden, oder?) Nienorion (talk) 09:48, 3 March 2021 (UTC)

Bestimmten Fehler in Beschreibungen findenEdit

Wie kann man sich die Items ausgeben lassen, die in der Beschreibung fälschlicherweise schweizer haben (Beispiel)? --Leyo 15:54, 3 March 2021 (UTC)

Keine Antwort auf deine Frage, aber ich erlaube mir mal einen Verweis auf Help:Description/de#Kleinbuchstabe am Anfang. (Edit: Liege falsch, Schande über mein Haupt, vgl. Duden) Deine Anforderung ließe sich mit SPARQL und FILTER(REGEX(…)) erfüllen. --Nw520 (talk) 17:57, 3 March 2021 (UTC)

@Leyo, Nw520: siehe

Der obige Hinweis ist hier unpassend, da Schweizer XYZ immer gross geschrieben wird.
Ich habe es so versucht, aber nicht der Gewünschte erhalten:
SELECT ?item ?itemLabel
WHERE { 
  ?item rdfs:label ?itemLabel. 
  FILTER(CONTAINS(LCASE(?itemLabel), "schweizer "@de)).
} limit 10

Gewünschte Bedingungen sind: Anfangsbuchstaben und direkt danach entweder ein Leerzeichen oder nichts mehr (also kein weiterer Buchstabe, denn schweizerische wäre ja korrekt). Dies klappt auch so nicht:

SELECT DISTINCT ?item ?label
WHERE
{
  SERVICE wikibase:mwapi
  {
    bd:serviceParam wikibase:endpoint "www.wikidata.org";
                    wikibase:api "Generator";
                    mwapi:generator "search";
                    mwapi:gsrsearch "inlabel:schweizer "@de;
                    mwapi:gsrlimit "max".
    ?item wikibase:apiOutputItem mwapi:title.
  }
  ?item rdfs:label ?label. FILTER( LANG(?label)="de" )
}

--Leyo 10:14, 4 March 2021 (UTC)

  • Ich würde SPARQL und CirrusSearch ganz rauslassen und mit dem SQL-basierten Termstore arbeiten, in dem alle Bezeichnungen, Beschreibungen und Aliase verfügbar sind. Eine entsprechende Abfrage mit Ergebnis ist über Quarry verfügbar. Das dauert zwar immernoch ein paar Minuten auszuführen, aber ist am Ende wohl die sauberste Lösung für diese Art von Anfragen. Timeouts spielen hier keine Rolle; SPARQL ist für diese Art von Abfragen grundsätzlich wenig geeignet.
    Es gibt übrigens auch "schweizerischer X", "deutsch-schweizer X", "zentralschweizer X" und so weiter. Wie wird da verfahren? Was ist der Unterschied zwischen "Schweizer" und "schweizerisch"? Ist diese Großschreibung von "Schweizer" eine Sache des Schweizer Hochdeutsch (de-ch), für das wir einen separaten Sprachcode haben, oder wird das im Standarddeutschen (Sprachcode de) allgemein so gehandhabt? —MisterSynergy (talk) 14:47, 4 March 2021 (UTC)
Besten Dank! Ich sah allerdings zuerst nur This query is currently executing..., dann This query took longer than 30 minutes to execute and was killed.
Laut §61 schreibt man Ableitungen von geografischen Eigennamen auf -er groß. Mit Schweizer Hochdeutsch hat dies nichts zu tun. Demnach ist von deinen Funden nur schweizerischer X korrekt, die anderen beiden nicht.
Der Unterschied zwischen Schweizer X und schweizerischer X ist gering. --Leyo 21:19, 4 March 2021 (UTC)
Hab den Fehler gemacht, die Abfrage einfach nochmal auszuführen. Heute nachmittag ging es in ~400 Sekunden, jetzt irgendwie nicht mehr. Ich sage Bescheid, wenn Du dort ein Ergebnis einsehen kannst. —MisterSynergy (talk) 21:25, 4 March 2021 (UTC)
Jetzt hat es geklappt. 644 Fälle (für de) in knapp 10 Minuten diesmal. —MisterSynergy (talk) 21:38, 4 March 2021 (UTC)
Vielen Dank! Puh, das sind arg viele für eine händische Korrektur. Bei vielen reicht die Änderung in Grossschreibung, bei etlichen anderen braucht es fallspezifische Anpassungen, z.B. bei deutsch-schweizer X. --Leyo 00:36, 5 March 2021 (UTC)
Naja, einen guten Teil kann man wohl automatisieren mit ein bisschen Suchen&Ersetzen und QuickStatements. Wie wären denn "deutsch-schweizer" richtig zu schreiben? "deutsch-Schweizer" etwa? —MisterSynergy (talk) 09:15, 5 March 2021 (UTC)
Nein, abhängig vom Geschlecht sowie Singular vs. Plural deutsch-schweizerisch(er/e/es). Bei Personen sollte das Geschlecht im betreffenden Item erfasst sein. --Leyo 10:37, 6 March 2021 (UTC)
Okay, Danke. Die einfacheren Fälle, in denen einfach "schweizer" durch "Schweizer" zu ersetzen war, habe ich erledigt. Es bleiben jetzt weniger als hundert, die dann eher doch händisch zu reparieren wären. Die Abfrage läuft gerade noch einmal… —MisterSynergy (talk) 10:50, 6 March 2021 (UTC)