Wikidata:GEPRIS

This page contains information about connecting GEPRIS (Q48879895), the database of projects funded by German Research Foundation with Wikidata. The database and its main audience are primarily German speaking so this page is German at least by now.

Das Ziel der Verknüpfung von GEPRIS mit Wikidata ist es alle wesentlichen Informationen zu DFG-geförderten Projekten nach Wikidata zu bringen. Dazu sind folgende Fragen zu beantworten:

  • Um welche Informationen handelt es sich (Umfang, Datenmodell...)?
  • Wie können die Informationen nach Wikidata gebracht werden (Import, Aktualisierung, Qualitätssicherung...)?

Datenmodell edit

Die GEPRIS-Hauptentitäten lassen sich direkt mit Wikidata-Items verknüpfen:

Projekte GEPRIS project ID (P4870)
Personen GEPRIS person ID (P4872)
Institutionen GEPRIS organization ID (P4871)

Die Verknüpfung von Personen und Projekten geschieht in GEPRIS entweder unter "als Antragsteller*in" oder "als beteiligte*r Wissenschaftler*in". Wie kann diese Verknüpfung in Wikidata ausgedrückt werden?

Projekte edit

Beispiele siehe unter Wikidata:Property_proposal/GEPRIS_project_ID.

Klassifikation der DFG-Verfahren edit

Siehe DFG-Homepage, hier noch unvollständig:

Die Klassifikation kann sich ändern, außerdem ist die Definition der DFG unter Umständen anders als in Wikidata.

Klassifikation der Fachlichen Zuordnungen edit

Mapping der DFG-Systematik zu Wikidata-Items über eigene Property?...

Die Klassifikationen können sich mit der Zeit ändern!

Personen edit

Organisationen edit

...

Import und Aktualisierung edit

  • Die Daten liegen nicht in strukturierter Form vor, werden aber derzeit gescrapt. Dazu wurde auch vorab die DFG angefragt.
  • Nicht alle Daten sollten importiert werden (zum Beispiel nicht Teil-Projekte, nur beteiligte Personen...)
  • Die Daten in GEPRIS ändern sich: Projekte kommen hinzu und werden verlängert, historische Daten werden gelöscht (ist zwar nicht sinnvoll, kommt aber vor), Personen ändern ihre Namen...
  • Für eine dauerhafte Lösung müsste vermutlich ein Bot oder Import-Tool programmiert werden. Für das Mapping reicht unter Umständen Mix'n'match. Durch den manuellen Import von Beispieldatensätzen sollen die Anforderungen an ein Bot/Import-Tool gesammelt werden, um die Umsetzbarkeit zu erleichtern.
  • Die DFG hat prinzipiell nichts gegen eine Weiternutzung der Daten, Details sollten aber vermutlich nochmal geklärt werden. (siehe oben, User:Claudiamuellerbirn stellt Kontakt noch mal her).
  • Was ist rechtlich und ethisch zu beachten?

Beteiligte edit