Home

 


Czech Properties

 

Maintenance Queries

 

Showcase Queries

 

Interesting external databases

 

Events

 

Tools

 

Thematic areas

 

Projects

 




Otázky byly sesbírány na technickém setkání české komunity Wikimedia na hackathonu v Národní technické knihovně

Úkolem této stránky je poskytnout odpovědi na základní otázky, které si kladou české instituce při seznamování s Wikidaty. Odpovědi byly sestaveny na základě dotazování české technické komunity tak, aby co nejvíce odpovídaly převládajícím pravidlům, normám a zvyklostem. Pokud zde nenajdete to, co jste hledali, budeme rádi, když na diskuzní stránce svůj problém popíšete.

Obecnější pohled na problematiku spolupráce českých institucí se světem Wikimedia podává stránka GLAM na české Wikipedii (https://glam.wikimedia.cz).

Principiální otázky edit

  • Co jsou Wikidata a jak se liší od Wikipedie? – Zatímco Wikipedie je encyklopedie, Wikidata jsou databáze. Wikipedii čtou lidé, záznamy na Wikidatech procházejí především stroje (programy). Aby se ve Wikidatech byly stroje schopné orientovat, dodržuje tato databáze pevně danou strukturu dat. Jinak ovšem mají Wikipedie a Wikidata leccos společného – jsou to kolaborativní projekty spravované nadací Wikimedia, jsou licencované pod svobodnými licencemi a jsou vzájemně propojené. Pro každý článek na Wikipedii tak existuje jeden datový záznam (položka) ve Wikidatech. Naopak to ovšem neplatí – ne každá položka na Wikidatech musí mít článek na Wikipedii a některé položky asi článek mít nikdy nebudou. Ve Wikidatech totiž platí mnohem volnější pravidla významnosti objektů než na Wikipedii.
  • Co z toho bude naše instituce/databáze mít? Jak na tom vyděláme? – Propojení vaší databáze s Wikidaty má pro vás celou řadu výhod kromě samotného faktu, že pomáháte dobré věci, na níž spolupracují lidé po celém světě a která slouží milionům uživatelů internetu každý den k získávání informací. Zaprvé se vaše data zviditelní – z Wikidat čerpá třeba Wikipedie, jeden z nejnavštěvovanějších webů na světě. Pomůžete jim najít správnou odpověď a navíc zvýšíte návštěvnost své databáze, protože údaje ve Wikidatech jsou vždy opatřené referencí (odkazem na původní zdroj – tedy vaši databázi). Vaše databáze se také posune o několik stupínků výše v kvalitě, neboť její napojení na Wikidata fakticky znamená vstupenku do vesmíru propojených dat (linked data). To dále umožní kontrolu správnosti vašich dat – srovnáním s jinými databázemi můžeme zjistit nesrovnalosti, které vám mohou posloužit pro další rozvíjení vaší databáze. Více na stránkách: Wikidata:Darování dat
  • Jak mohu data kontrolovat poté, co byla importována do Wikidat? – Data, která importujeme do Wikidat, se stávají součástí kolektivně budované databáze, kterou může kdokoliv dále upravovat (včetně vás). Vaše instituce nemá formálně silnější slovo než zbytek komunity, ale v praxi autoritám pečlivě nasloucháme. Některé databáze pečlivě sledují vývoj „své“ datové sady na Wikidatech, protože to pro ně představuje zajímavý zdroj informací o vlastní databázi. Například je možné srovnávat shodu některých parametrů mezi Wikidaty a vaší databází (u personálních databází například porovnávat datum narození) a tím vyhledávat zřejmé rozpory mezi oběma databázemi.
  • Jak v rámci pravidel Wikidat maximálně zajistit uvedení původu dat (externí odkazy z Wikidat směrem do institucí, abychom si uchovali návštěvnost)? Můžete garantovat odkazy z Wikidat a Wikipedie? – Pokud od vás získáme data, dle pravidel na Wikidatech budete u každého údaje uvedeni jako původce i s odkazem na něj. Výhodou pro vás bude, pokud půjde vaše data nějak identifikovat (unikátní identifikátory či permalinky, kontrolní součet, …), protože takové odkazy tolik nezastarávají. Odkazy z Wikipedie nebo od jiných uživatelů dat garantovat nemůžeme, protože data jsou na Wikidatech dostupná pod licencí CC-0, která po třetích stranách nevyžaduje uvedení původu. Platí, že pro Wikipedii i pro mnohé třetí strany bývají zajímavější data s označením původu (zdroje), neboť působí hodnověrněji, takže tuto skutečnost například Wikipedie často uvádí formou řádkových referencí na původní pramen informací.
  • Budujeme novou databázi / Přepracováváme starší databázi. Jak by měla naše databáze vypadat, abychom ji mohli integrovat s Wikidaty? – Kromě právních aspektů, které jsou zmíněny níže, by vaše databáze měla být ideálně veřejně dostupná (abychom na ni mohli odkázat při citování informací), data v ní by měla být opatřena vysvětlivkami (co který parametr znamená) a měla by být přiměřeně vyčištěná od chyb a duplicit. Podrobnější informace připravujeme na stránce Wikidata:WikiProject Czech Republic/Pro instituce/Vzorná databáze.

Právní otázky edit

Přednáška JUDr. Jakuba Míška o právní úpravě databází
 
Brožura Otevřená data / Současný stav a doporučení pro otevírání dat (PDF)
  • Co je to CC-0? – Doložka CC-0 (nesprávně označovaná jako „licence“) dává svolení s vystavením datové sady jako díla volného bez jakýchkoliv dalších podmínek. Veškerá data na Wikidatech jsou distribuována pod CC-0. Chce-li kdokoliv užít data z Wikidat, nemusí uvádět ani zdroj. Přesto Wikidata na základě svých vnitřních pravidel vždy zdroj uvádí, a to formou referencí (odkazů) na původní pramen dané informace. Doložkou CC-0 se vzdáváme především tzv. zvláštního práva pořizovatele databáze (další informace dále).
  • Co je to vzdání se práv pořizovatele databáze? A kde je hranice systematického vytěžování? Může pořizovatel databáze vyjádřit souhlas jen ústně/písemně/e-mailem? – Některé databáze vytvořené občany a rezidenty Evropské unie a organizacemi se sídlem v EU podléhají speciálnímu právu duševního vlastnictví, tzv. právu pořizovatele databáze (tzv. sui generis databázové právo), které upravuje systematické vytěžování databází a v praxi představuje jedinou právní překážku pro využití dat ve Wikidatech. Existují však i databáze, kde se tato práva neuplatní, např. takové, do nichž nebyl při jejich vytváření učiněn kvalitativně či kvantitativně podstatný vklad či takové, u nichž k vyloučení ochrany existuje veřejný zájem. Z praxe však je většina databází importovaných do Wikidat k tomuto typu ochrany způsobilá. Pokud tedy chceme do Wikidat systematicky přenést databázi vytvořenou českými občany či společnostmi, musí se pořizovatel databáze tohoto zvláštního práva vzdát. Nejvhodnějším způsobem je vzdát se těchto práv prostřednictvím CC-0, připouštíme i prosté vzdání se práv pořizovatele databáze, například e-mailem či písemně (ústní svolení není vhodné). Wikidata postupně zpřesňují svá pravidla a postupy pro zpřístupňování datových sad.
  • Je možné propojit databázi s Wikidaty (odkazováním na identifikátor), aniž bychom měli souhlas pořizovatele databáze? – Propojení databází na základě importu vašich unikátních identifikátorů je dobrým prvním krokem v přípravě dlouhodobé spolupráce, protože skutečně nevyžaduje souhlas pořizovatele (provozovatele) databáze. Zjednodušeně řečeno, jedná se o prosté odkazování, a nikoliv vytěžování databáze. Po tomto propojení je daleko jednodušší následný import (který už často podléhá svolení pořizovatele databáze).
  • Naši databázi tvoří komunita přispěvatelů. Můžeme ji jako pořizovatelé importovat do Wikidat, nebo se musíme zeptat jednotlivých vkladatelů? – Záznamy v databázi jsou typicky strukturovanými tabulkovými přehledy, na které se nevztahuje autorskoprávní ochrana, a v tom případě přichází v úvahu jen zvláštní právo pořizovatele databáze. Tohoto práva se pořizovatel může vzdát prostřednictvím CC-0, na což se není potřeba jednotlivých přispěvovatelů databáze ptát. Práce jednotlivých přispěvatelů se totiž většinou nedá klasifikovat jako pořizování celé databáze. Pořizovatel databáze je definován jako osoba, která učinila podstatný vklad a zároveň dala podnět ke vzniku databáze. Jiná situace je u databází, kde jsou výstupem činnosti jednotlivých vkladatelů autorská díla, podléhající ochraně podle autorského zákona (například multimédia nebo dlouhé texty). Ty se ovšem zpravidla do Wikidat nehodí (media jsou hostována na serveru Wikimedia Commons, dlouhé texty patří např. do Wikipedie) a proto nejsou pro Wikidata taková díla relevantní.
  • Nebrání ve sdílení našich dat evropská nařízení GDPR? – Mnoho databází žádné osobní údaje ve smyslu evropského nařízení GDPR (2016/679) neobsahuje a v tom případě si není nutné dělat starosti. Pokud vaše databáze osobní údaje shromažďuje, editoři Wikidat se dostávají do pozice jejich správců. Tito editoři si musí vyhodnotit, zda existuje oprávněný zájem na zpracování daných dat ve Wikidatech a zda takové využití nezasahuje příliš do práv a zájmů subjektu osobních údajů, včetně přihlédnutí k jeho oprávněnému očekávání, jak bude s jeho údaji nakládáno. Při přebírání volně dostupných databází s osobními údaji je proto nutné pečlivě zvážit povahu a rizikovost osobních údajů, které takto přebírám. U drtivé většině běžně importovaných veřejných databází pravděpodobně editoři shledají, že oprávněný zájem existuje (import do Wikidat například umožňuje integraci databází, využití dat na Wikipedii, kontrolu kvality, jedná se o projev svobody projevu ve vztahu k šíření znalostí atd). K subjektům, které se na nás či na provozovatele (nadaci Wikimedia Foundation) obrací s námitkou proti zpracování údajů, se chováme s respektem a zvážíme uměřenost jejich námitky. Odstranění dat v případě pozitivního posouzení námitek však nemají jednotliví editoři, nýbrž komunitou pověření techničtí správci nebo nadace Wikimedia Foundation. Pro podrobnější informace navštivte stránku Wikidata:Living people.
  • Mohu jako „řádný hospodář“ dovolit import dat naší instituce do Wikidat? Nebudu právně popotahován? – Ano, mohu. Právní úprava nakládání s majetkem státu jako jeden ze základních důvodů pro využití majetku státu jeho organizačními složkami uvádí „plnění funkcí státu“ s přidanou povinností, že majetek musí být využíván účelně a hospodárně. Poskytování a šíření informací veřejného sektoru, které umožňuje následné využití, je plněním funkcí státu. To vyplývá zejména z evropské právní úpravy informací veřejného sektoru (směrnice 2003/98/ES). Krom toho, pokud databáze není nijak chráněná (například proto, že už došlo ke vzdání se práv pořizovatele databáze, případně proto, že tam žádná práva ani nebyla), není možné hovořit o tom, že by importem došlo k nakládání s majetkem. Samotná data nejsou nijak právně chráněná.

Podrobné informace o autorskoprávní ochraně databází najdete také na stránce Stanovení podmínek užití otevřených dat na opendata.gov.cz (návod na vytvoření licenčních oprávnění pro bezproblémové užití otevřených dat).

Logistické otázky edit

 
Workflow importu z publikace Wikimedia Deutschland, která popisuje využití Wikidata v kulturních institucích
  • Naši lidé na to nemají čas. Co s tím? Koho kontaktovat? – Wikidata jsou projekt nadace Wikimedia Foundation a v České republice jim zajišťuje institucionální podporu spolek Wikimedia Česká republika. V otázkách týkajících se Wikidat nás můžete kontaktovat na adrese databaze wikimedia.cz. Spolek vám z kapacitních důvodů nemůže garantovat plnou realizaci vašich záměrů, ale pokusíme se odpovědět na vaše otázky a poradit ohledně dalšího postupu. U dlouhodobějších či složitějších projektů se ve světě osvědčuje model tzv. wikidatistů „in residence“ (wikidatistů-rezidentů), kteří jsou na určitou dobu najímáni organizacemi k realizaci vašich záměrů. Můžeme vám pomoci najít tu správnou osobu a metodicky ji společně s vámi vést. Se svými dotazy a návrhy se také můžete zkusit obrátit na českou komunitu dobrovolníků spravujících Wikidata – nejživější diskuze naleznete na Facebooku ve skupině Wikidata CS.
  • Jak dlouho bude import trvat? – Samotný import dat je obvykle otázka několika hodin, ale příprava dat může trvat velmi dlouho. V první fázi je potřeba ujasnit si datový model vhodný pro váš typ dat a založit případně nové vlastnosti na míru vašim databázím. V druhé fázi musíme spárovat vaše data s existujícími položkami ve Wikidatech, aby importem nevznikly zbytečné duplicity. Teprve pak následuje import, po němž ještě data zkontrolujeme a opravíme. Je potřeba počítat s tím, že ne vždy se hned najde dobrovolník ochotný pracovat s vašimi daty, někdy to trvá.
  • Záznamy v naší databázi už položky ve Wikidatech mají, jen nejsou propojeny. Není to problém? – Propojení dvou databází vždy představuje výzvu pro jejich provozovatele. Na Wikidatech s propojováním databází máme velké zkušenosti. Velmi pomůže, pokud vaše databáze už používá unikátní identifikátory (například číselné kódy odpovídající jednotlivým záznamům ve vaší databázi). Těmto identifikátorům založíme tzv. vlastnost na Wikidatech. K samotnému spárování s existujícími záznamy používáme různé metody – k těm automatickým patří párování podle společného identifikátoru, jejž obě databáze už evidují, nebo u osob např. párování podle stejného jména a data narození. Poloautomatické a manuální propojení zpravidla realizujeme za pomoci různých nástrojů, jako je Mix'n'Match nebo POI Import.
  • K databázi neexistují žádné Wikidata položky, je to „pole neorané“. Není to problém? – To naopak může situaci usnadnit. Proces párování je poměrně pracná záležitost a zabere mnoho času. Pokud záznamy ve vaší databázi splňují definici záznamů ve Wikidatech, nic nebrání jejich importování do Wikidat, i kdyby to mělo vést k vytvoření tisíců nových položek.