Wikidata:Mezi bajty/Archive/2021

This page is an archive. Please do not modify it. Use the current page, even to continue an old discussion.

Lexémy

Ahoj, kdo se tady z české komunity zajimá o lexémy? Snažím se zmonitorovat kolik nás je. Michal Josef Špaček (WMCZ) (talk) 08:58, 1 December 2020 (UTC)

FYI @Strepon:,   Notified participants of WikiProject Czech Republic. Michal Josef Špaček (WMCZ) (talk) 08:59, 1 December 2020 (UTC)
Minimálně, nerozumím tomu. Ale bylo by sexy importovat nějakej slovník. Nebo můžeme začít městy a obcemi, ty v RUIANu pod svobodnou licencí mají i skloňování. --Frettie (talk) 09:25, 1 December 2020 (UTC)
RUIAN bohužel nepůjde, má licenci CC-BY. Vhodné by mi připadalo naimportovat z Wikislovníku příspěvky těch, kteří souhlasili s uvolněním pod CC0 - jako třeba tady Sintakso. --Strepon (talk) 22:07, 6 December 2020 (UTC)
Proč si myslíte, že je RÚIAN pod CC-BY? IMHO je to zjevně úřední dílo. --Mormegil (talk) 17:36, 4 January 2021 (UTC)
Vycházím z toho, co píše ČÚZK na svých stránkách. --Strepon (talk) 18:11, 4 January 2021 (UTC)
Téma lexémů mě zajímá, ale bohužel mi v poslední době nezbývá příliš času se mu nějak blíže věnovat. Sintakso (talk) 20:01, 1 December 2020 (UTC)
Jednou jsem se mezi lexémy dostal, chtěl jsem začít přidávat, ale nevěděl jsem, kde začít. Neorientuji se v tom. Nebyl čas podívat se na to podrobněji. --YjM | dc 12:56, 2 December 2020 (UTC)
Zatím jsem se k tomu nedostal, ale plánujeme s Connym výhledově zpracovat terminologii okolo podstávkových domů. Já osobně tedy okolo lidové architektury obecně. Ale jak má takový lexé na Wikidatech vypadat, to nemám ani páru. To si budu muset teprve zjistit ;-) Jedudědek (talk) 15:07, 2 December 2020 (UTC)
Pár jsem jich kdysi přidal, ale je to ručně docela dost práce, chtělo by to vhodný skript. Momentálně se jim nevěnuju, třeba zase časem. JAn Dudík (talk) 21:04, 2 December 2020 (UTC)
@JAn Dudík: Existují různé pomocné nástroje jako https://lexeme-forms.toolforge.org/, kde je to značně jednodušší vytvořit. Michal Josef Špaček (WMCZ) (talk) 14:37, 4 January 2021 (UTC)
FYI. Existuje stránka ukázkových lexémů, kterou jsem přeložil do češtiny. Tam bych rád dostal nějaké české slova. Je to hezký začátek pro to, kouknout jak ta datová struktura vypadá. Michal Josef Špaček (WMCZ) (talk) 13:07, 5 December 2020 (UTC)
@Michal Josef Špaček (WMCZ): O tomhle nástroji vím, je to s nim o něco snazší, ale pro člověka zhýčkaného z Wikislovníku, kde stačí udělat {{subst:Vzor hrad|disk}} a mám hned vyplněno všech 14 tvarů podstatného jména je to stále příliš zdlouhavé. Přitom by stačilo povolit importy z wikislovníků a hned by to šlo mnohem snáz...JAn Dudík (talk) 18:02, 4 January 2021 (UTC)
@JAn Dudík: Hezké, takže jednoduchá web aplikace, která může dělat to stejné nad Wikidaty. Dík za tip. Michal Josef Špaček (WMCZ) (talk) 18:21, 5 January 2021 (UTC)

Jednobran vs. port

Ahoj, není tu někdo elektrikář? Mě přijde, že položky one-port circuit (Q12024385) a port (Q2443617) jsou duplicitní, ale nejsem si tím jako laik v oboru jistý. Přijde mi, že s nimi propojené články (cs vs. en) popisují v podstatě totéž, jen trochu z jiného úhlu pohledu. Nechci slučovat, abych nenatropil víc škody, než užitku. Díky --YjM | dc 22:24, 4 January 2021 (UTC)

@YjM: Ahoj, mně z toho vychází, že české (a slovenské) heslo Jednobran odpovídá v enwiki jen tomu oddílu „one-port“. --GeXeS (talk) 09:27, 5 January 2021 (UTC)
Ano. Ty položky jsem (snad správně) uklidil a doplnil. --Mormegil (talk) 13:13, 5 January 2021 (UTC)
Skvělé, díky! --YjM | dc 18:19, 5 January 2021 (UTC)

Prosba o opravu referencí botem

Ahoj, kdysi jsem při importu udělal chybu a teď to na mě neustále vyskakuje v různých položkách, do nichž jsem tím importem zasáhl. Jedná se o těchto 1448 výskytů: https://w.wiki/t9W , kde by místo vlastnosti point in time (P585) mělo být retrieved (P813) . Byl by někdo ochoten na to pustit bota a odstranit v referencích to datum a nahradit to daty přístupu? Díky, Vojtěch Dostál (talk) 09:22, 4 January 2021 (UTC)

  Done --Mormegil (talk) 08:00, 6 January 2021 (UTC)
Díky moc, Mormegile.Vojtěch Dostál (talk) 08:06, 6 January 2021 (UTC)

Vyjmenovaná slova

Ahoj, víte někdo, jakým způsobem můžu označit slovo na Wikidatech (Lexémy) jako vyjmenované slovo (např. listed words (Q11945226), babyka (L43079))? Skim (talk) 07:58, 13 January 2021 (UTC)

Přemýšlel jsem o part of (P361), has characteristic (P1552) nebo collection (P195), ale nejvhodnější je podle mě obecná instance of (P31). --Matěj Suchánek (talk) 14:29, 13 January 2021 (UTC)
Zajímavé. Asi nejlepší je opravdu instance of (P31), protože se to používá:
SELECT DISTINCT ?instance_of ?instance_ofLabel WHERE { 
  ?item wdt:P31 ?instance_of. 
  ?item a ontolex:LexicalEntry.
  SERVICE wikibase:label { bd:serviceParam wikibase:language "cs" }
}
Try it!

Přidal jsem babyku :-). Dík. Skim (talk) 16:04, 13 January 2021 (UTC)

Šance

Ahoj, kamarád narazil na zvláštní situaci: Šance Dam (Q1752953) a Šance Reservoir (Q47192200). Když jsem koukal na ty články, tak mi přijde, že je to to stejné. Jedno je "Dam", druhé "Dam lake". Co s tím? Skim (talk) 21:52, 15 January 2021 (UTC)

Teď někdy nedávno to tu někdo systematicky rozděloval, přehrady zvlášť od přehradních nádrží (a propojené pomocí dam (P4792)). Nějakou logiku to má, interwiki je trochu oběť (a náhoda, která wiki články koncipuje a pojmenovává spíš podle vody, nebo podle betonu). --Mormegil (talk) 22:40, 15 January 2021 (UTC)
V češtině nejsme moc zvyklí to rozlišovat, ale z pohledu třeba anglicky mluvícího je asi docela rozdíl mezi vodní nádrží a přehradou (hrází), která tuto vodní nádrž vytvořila.Vojtěch Dostál (talk) 06:44, 18 January 2021 (UTC)
ok, já přesunu ty články k vodní nádrži, protože se tam primárně mluví o ní. Skim (talk) 11:14, 18 January 2021 (UTC)
@Skim, Mormegil, Vojtěch Dostál: Není to zvláštní, ale naopak velmi očekávatelné. Co jsem si tedy všiml, tak v angličtině to funguje úplně stejně jako v češtině, že v hovorové řeči se název "dam" metonymicky přenáší i na celou nádrž, ale striktně vzato je hráz samozřejmě něco jiného než nádrž neboli přehradní jezero. A někde se nám zase může hráz míchat dohromady s hydroelektrárnou. Články jsou samozřejmě většinou o obojím současně, o hrázi i o nádrži, v Commons je naopak vhodné, že hráz zpravidla bude mít vlastní podkategorii. Jako stavba je důležitější hráz, jako krajinný prvek je důležitější nádrž. Na anglické Wikipedii i v Commons je "dams" podkategorií kategorie "reservoirs", ale seznamy se jmenují vesměs Lists of dams and reservoirs, u článků to je namíchané skoro půl napůl. --ŠJů (talk) 18:34, 24 January 2021 (UTC)

Několik podivností u Prahy

Trochu jsem zkoumal Prahu (Q1085) a narazil na několik problémů:

  • Canadiana Authorities ID (P1670): "The document is not available"
  • Czech Registration ID (P4156): "Počet nalezených subjektů: 0" => nebyl by lepší ARES?
  • Czech territorial region ID (P7736): "Error 404--Not Found"
  • Fandom article ID (P6262): "Bad title"
  • FIPS 10-4 (countries and regions) (P901): "404 Error The page you requested doesn’t exist."
  • ILI ID (P5063): "502 Bad Gateway"
  • Instagram username (P2003): "Je nám líto, ale tato stránka není dostupná."

--DaRe (talk) 21:34, 16 January 2021 (UTC)

Většinou jde mrtvé/zastaralé formatter URL (P1630). Ty je nutné rešit na diskusních stránkách příšlušných vlastností.
ARES je u Czech Registration ID (IČO) (P4156) jendním z third-party formatter URL (P3303), bohužel Wikidata zatím neumí third-party formatter URL (P3303) nijak v rámci UI využít. Komu link na ARES chybí, může použít třeba User:Jklamo/ARES.js.--Jklamo (talk) 22:35, 16 January 2021 (UTC)
Děkuji za nakopnutí správným směrem.--DaRe (talk) 21:38, 17 January 2021 (UTC)
Konkrétně u toho Czech Registration ID (IČO) (P4156) jsem pro to, změnit primární formátovač, protože takhle je spousta id nefunkčních (neplatné subjekty, státní instituce, atd.). Skim (talk) 11:26, 18 January 2021 (UTC)
Také se přimlouvám. --DaRe (talk) 15:03, 19 January 2021 (UTC)

Přesnost na rok - vkládat 01-01 nebo 00-00?

Hezký den, všiml jsem si, že někdy se např. data narození s přesností na rok vkládají jako den 00-00, někdy jako den 01-01. Dělá to docela problémy při importech - QuickStatements to chápe jako dvě různé hodnoty, viz např. Dietrich Gerhardt (Q94795358). V JSON verzi je vidět, že jednou je tam +1866-00-00T00:00:00Z a jednou +1866-01-01T00:00:00Z. Je to nějak sjednocené? Podle mně ne, protože cca v 50 % vidím první variantu a v 50 % druhou... Vojtěch Dostál (talk) 11:20, 23 January 2021 (UTC)

Sjednocené to není vůbec a není IMHO ani moc jasná sémantika, navíc jde zapsat i cokoli jiného, např. 2020-10-03 s přesností na rok... (A navíc to má vliv třeba na vyhodnocování omezení atd...) Až donedávna jsem ani nevěděl, že tam jde uvést to -00-00 a přijde mi to jako nesmysl... --Mormegil (talk) 13:10, 23 January 2021 (UTC)
Hm, bylo by asi dobré, kdyby existoval bot, který bude podobná data vyhledávat a sjednocovat na jeden formát. Asi bychom měli dotaz položit do mezinárodní komunity. Vojtěch Dostál (talk) 11:40, 24 January 2021 (UTC)
Ono je to ještě horší: Někdy to může být naschvál; existují třeba rady nastavit tam nějakou speciální hodnotu proto, aby to schroustala kontrola omezení v případě nižší přesnosti… --Mormegil (talk) 16:02, 24 January 2021 (UTC)
To bych snad úplně ignoroval... že backend neumí schroupat správně data je věc backendu, to přece nemůže ovlivňovat plnění databáze :( Vojtěch Dostál (talk) 16:57, 24 January 2021 (UTC)
Nojo, ale pokud chceš někde snižovat entropii, je potřeba vědět, jestli tím vyhazuju šum, nebo odebírám (užitečnou) informaci. A abych se rozhodnul, který z těch případů platí, musím vědět, jak je definovaná ta sémantika. A přiznám se, že jako úplně nevím… U datového typu kvantita je to vcelku jednoznačné: můžu napsat X=12345±1000. To je sice zápis trochu divný, ale je vcelku jasně vidět, co se tím myslí ( ). Ovšem u času to moc jasné není. Co přesně znamená 2020-10-03/9? Totéž co 2020-00-00/9? Něco jiného (třeba „2020-10-03 ± 1 rok“, tzn. „někdy mezi 2019-10-03 a 2021-10-03“, nebo možná něco jako „2020-10-03 ± 0,5 roku“)? Nevím. Vedle toho teoreticky existují údaje before a after, pomocí kterých můžu napsat něco jako „mezi 1846 a 1855“, ale v GUI se to zřejmě úplně ignoruje a bůhví, jestli na to bere ohled vůbec někdo někde (či zda se podpora někde plánuje). Takže jestli něco, tak spíš nějak mezinárodně řešit, aby se ta sémantika jasně definovala a doimplementovalo to, co teď naimplementováno není. (Jak to before a after, tak i třeba ten phab:T168379.) --Mormegil (talk) 12:38, 28 January 2021 (UTC)

Prosba. Našel by se dobrovolník, který by mi napsal Query, jehož výstupem by byl celkový počet podstávkových domů a počet podstávkových domů podle jednotlivých zemí? Případně pro zjednodušení, zajímá mě pouze ČR, DE a PL. A kdyby šlo jako doplňující údaj kolik položek z toho má fotografii, bylo by to úplně super ;-) Případnému dobrodinci předem díky! Jedudědek (talk) 21:14, 30 January 2021 (UTC)

Jiné asi ani nejsou, to vypadá… https://w.wiki/wuY (Snad, bez záruky, trochu jsem se s tím pral.) --Mormegil (talk) 22:49, 30 January 2021 (UTC)
Díky moc! Jiné nejsou, ale čistě teoreticky by se časem mohly objevit (ale mě tyto stačí). Já jsem se to snažil před časem taky přeprat, ale zvládnul jsem pouze jednotlivý dotaz. Jedudědek (talk) 22:57, 30 January 2021 (UTC)

Přesměrování po sloučení

Zdravím všechny kolegy, včera jsem sloučil položku kamenná stavebnice a zjistil jsem že zůstalo přesměrování. Mám to prosím nějak řešit? Díky za reakci. S pozdravem--F.ponizil (talk) 23:32, 6 March 2021 (UTC)

No a co byste na tom chtěl řešit? To je právě úplně v pořádku, že po sloučení zůstalo přesměrování...? --Mormegil (talk) 08:37, 7 March 2021 (UTC)

Voskovec & Werich

Ahoj, protože jsem tu ke svému podivu nenašel položku pro dvojici Voskovec & Werich, založil jsem ji. Když jsem hledal v databázi Národní knihovny, našel jsem tuto položku, u které (na rozdíl od jiných případů, zřejmě ale náhodných) nebyl odkaz na Wikidata. Když jsem ale identifikátor přidal, zjistil jsem, že jej již používá položka Q74369500. Co byste teď radili? Nechat dvě položky, z V+W odstranit identifikátory a třeba položky propojit přes údajně totéž co, případně s vymezením platí pro část erotická poezie? Nebo případně sloučit? Díky. Gumruch (talk) 16:09, 14 March 2021 (UTC)

@Gumruch: Považoval bych to za identické koncepty, sloučil bych. Ještě jsem do Voskovec and Werich (Q74369500) přidal instance: duo. Vojtěch Dostál (talk) 12:04, 16 March 2021 (UTC)
Souhlas, sloučil jsem to. (Dávaly by smysl i oddělené položky, kdybychom už např. měli nějaká díla podepsaná tím konkrétním pseudonymem nebo to z jiného důvodu potřebovali rozlišovat, ale ten společný pseudonym byl zatím bez odkazů, tak je to takhle jednodušší IMHO lepší.) --Mormegil (talk) 13:12, 16 March 2021 (UTC)
Domníval jsem se, že řešení případů typu "Cyril a Metoděj" už je dávno nějak vymyšlené a jde o naprosto rutinní záležitost. (Odkaz http://aut.nkp.cz/ bohužel na žádnou položku databáze Národní knihovny neodkazuje, takže těžko posoudit, jestli tam mají vhodný odkaz do Wikidat). --ŠJů (talk) 21:40, 21 March 2021 (UTC)
@ŠJů: Aha, koukám, že jsem původně zapomněl dát odkaz na konkrétní položku, mělo se jednat o http://aut.nkp.cz/jo2008446843. Nevím, na čem záleží, zda se v tamní databázi generuje zpětný odkaz na Wikidata, někdy tam je, někdy ne. Ani teď se v té konkrétní položce nezobrazuje. Pokud ale v návaznosti na Wikidata existuje i nějaký článěk na Wikipedii, je tam odkaz prakticky vždy. Gumruch (talk) 10:41, 22 March 2021 (UTC)
@Gumruch: Mnoho let z národních autorit docházelo k odkazování jen na články na Wikipedii. Pak Mormegil implementoval i odkazování na Wikidata položky (tam kde není k dispozici článek) ale došlo k chybě v komunikaci a Národní knihovna tyto odkazy zase začala odfiltrovávat pryč. Nyní je k dispozici nástroj NK-link, který to umí dělat na pokročilejší úrovni, ale čekáme, kdy ho NK implementuje (pravidelně slušně upomínáme, že by to bylo fajn). Až bude implementován, snad bude odkazování zase fungovat. Nyní se odkaz na Wikidata položky vytváří jen v případě, že je QID ručně vloženo do knihovnického záznamu v bázi autorit (v poli 024).Vojtěch Dostál (talk) 12:28, 22 March 2021 (UTC)

IČO

Zjistil jsem, že vlastnost Czech Registration ID (IČO) (P4156) má nastaveno, že položky s touto vlastností musí obsahovat vlastnost instance of (P31) s třídou organization (Q43229) nebo juridical person (Q155076), případně jednou z jejích podtříd. IČO je však přidělováno i podnikajícím fyzickým osobám (např. Jiří Paroubek (Q161671)), u kterých to pak hází chybu. S přidělováním IČO podnikajícím fyzickým osobám souvisí také problém s automaticky formátovaným odkazem do obchodního rejstříku, kde podnikající fyzické osoby nejsou. Jelikož jsem na Wikidatech začátečník, rád bych se poradil, jak by bylo možné upravit omezení u IČO, aby zahrnovalo i podnikající fyzické osoby. U druhého problému (odkazy do obchodního rejstříku) nevím, zda by nějaké řešení (někdy odkazovat na živnostenský rejstřík) bylo technicky proveditelné, budu rád za odpověď někoho zkušenějšího. Albert Horáček (talk) 18:52, 5 March 2021 (UTC)

Nejsem si jistý, zda uvádět ičo i u fyzických osob. Nevím ani, zda existuje jednotný odkaz pro fyzické i právnické osoby. Možná by bylo řešením založit novou vlastnost IČO fyzické osoby? JAn Dudík (talk) 12:50, 7 March 2021 (UTC)
O tomhle jsme už tak různě několikrát diskutovali. Já si pořád nejsem jist, jestli je dobrý nápad uvádět IČO i u fyzických osob; spíš jsem trochu proti. Jistou alternativou (datově IMHO trochu správnější) je zakládat pro živnosti samostatnou položku, viz např. Q65515913, ale je otázka, jestli stojí za to, zakládat položky pro různé živnosti moderátorů apod., u kterých se do vyplňování IČO teď někdo pustil; a jestli takové položky by vůbec byly v záběru Wikidat; tím si také nejsem jist, já bych to fakt obecně spíš nedělal vůbec.
Samostatnou vlastnost pro „IČO fyzické osoby“ bych každopádně nezakládal, to mi nedává žádný smysl, IČO existuje jen jedno společné.
Je fakt, že aktuálně nastavený primární formátovač směřující na obchodní rejstřík je v zásadě špatně, protože v obchodním rejstříku je jen velmi omezená část subjektů majících IČO. Správnější by asi bylo překonfigurovat to na ARES, který je momentálně jako vedlejší. (Pro mě je asi prakticky užitečnější ten OR, ale už jsem si na ty formátovače vyrobil udělátko, takže je mi to už fuk. :-) )
--Mormegil (talk) 15:18, 9 March 2021 (UTC)
Souhlasím s Vámi, také nepovažuji za vhodné zakládat samostatnou položku „IČO fyzické osoby“. Zároveň však nevím, zda lze oddělit fyzickou osobu a její živnost. U Vámi uváděného příkladu Q65515913 mi pak připadá absurdní tvrzení owned by (P127): Juraj Podkonický (Q12027236). Ostatně, nebylo by možné vytvořit nějakou podmínku s. r. o. + a. s. → obchodní rejstřík; živnostníci → živnostenský rejstřík atd.? Neznám však možnosti Wikidat, klidně mi napište, pokud je to nesmysl. --Albert Horáček (talk) 13:19, 12 March 2021 (UTC)
Ano, už jsme to diskutovali, lepší jsou samostatné položky, i živnostník může mít stovky zaměstnanců a obrat v řádu stovek milionů, viz Vladimír Hrubý (Q58490918), časté jsou také nakladatelství živnostníci. Ten příklad zas tak absurdní není, prostě živnost "Juraj Podkonický - soudní exekutor" vlastní fyzická osoba pan Juraj Podkonický.
Co s živnostmi moderátorů, politiků apod. je otázka, já bych se bez nich klidně obešel úplně.--Jklamo (talk) 14:52, 12 March 2021 (UTC)
owned by (P127) možná není úplně ideální vlastnost, ale nějak by s tou fyzickou osobou propojena být měla a zase úplně nesmyslné to IMHO není… „Zda lze“… proč by nešlo. :-) Ba dokonce je to i z hlediska zákona do jisté míry pravda – např. mohou živnost i po smrti toho původního živnostníka provozovat po dobu dědického řízení potenciální dědici… (Tohle samo o sobě asi není z hlediska úplně zajímavé, ale chci tím ilustrovat, že to není jedna nedělitelná entita.) A při smíchání živnosti do položky přímo toho člověka naopak budeme mít v položce toho člověka velmi matoucí vlastnosti typu „počet zaměstnanců“ (tedy… ano, ten člověk má nějaké zaměstnance, ale…) či dokonce sídlo či datum založení… :-/ To je podle mě neudržitelné.
Obávám se, že takové rozlišování toho odkazovače úplně jednoduše nejde. Ale myslím, že ten ARES je dostatečně obecný, že zahrnuje snad všechny, takže bych se přikláněl k tomu přepnutí na ARES a odkazy na RŽP a OR bych nechal v těch alternativních formátovačích.
--Mormegil (talk) 15:15, 12 March 2021 (UTC)

@Albert Horáček, Mormegil, Jklamo: Nejčistším řešením samozřejmě je, abychom pro podnikající fyzickou osobu měli tutéž položku jako pro tu samou osobu. Rozdělovat jednu osobu na dvě položky, jednu podnikající a jednu občanskou, je podobně absurdní, jako bychom jinou položku měli pro občana Václava Klause, jinou pro ekonoma Václava Klause, jinou pro předsedu vlády Václava Klause, jinou pro předsedu ODS Václava Klause a jinou pro prezidenta Václava Klause a ještě jinou pro spisovatele Václava Klause. Ve všech rolích je to stále jeden a tentýž člověk, stejně jako by to byl stále on, i kdyby byl živnostníkem, a to stále platí, i kdyby v některé z těch rolí měl deset placených poradců, asistentů či zmocněnců nebo tisíc zaměstnanců. Zaměstnavatelem těch lidí by byl on, majitelem toho podniku (zde myslím podnik jako provoz, ne jako subjekt) by byl on, nikoliv nějaká společnost či organizace. Na druhou stranu bychom zde asi měli počítat i s tím, že o jednom subjektu vznikne více článků, každý o jiném aspektu nebo jiném období jeho činnosti - typické například pro obchodní společnost, která projde transformací a zásadním rebrandingem, takže pod stejným IČ se najednou objeví vlastně úplně jiná firma, nebo pro stát, který změní název, ústavu či své mezinárodní postavení, například tu máme celou řadu položek, jejichž předmětem je Československo v různých etapách své existence. Pak bychom tu asi měli mít nějaké vlastnosti, které by vyjádřily vztah mezi těmi položkami. A co když má živnostník více živností či "živnostenských provozů" v různých oborech a třeba i pod různými obchodními značkami, avšak samozřejmě se shodným IČ? A naopak je docela běžné, že někdo začíná své podnikání jako živnostník a pak to podnikání pod stejnou značkou nenápadně transformuje na eseróčko, aniž by si toho veřejnost musela vůbec všimnout, přitom de facto jde stále o jeden podnik/provoz, pro takové případy se hodí mít předem podnikatelskou identitu v samostatné položce.

Existuje vlastnost subject has role (P2868) a inverzní položka (nikoliv vlastnost) is role of (Q96439837), ovšem jak by šly využít ke kódování vztahu mezi osobou jako takovou a osobou v roli živnostníka, to si moc nedokážu představit. Struktura Wikidat mi z tohoto hlediska stále připadá poněkud chaotická. --ŠJů (talk) 04:08, 31 March 2021 (UTC)

Řeholní jméno

U Christian Martin Pšenička (Q95182166) jsem narazil na problém, který má asi potenciál se opakovat – a to, že religious name (P1635) (Christián) je uvedeno jako given name (P735). Nevím, jak k tomu úplně přistoupit, např. Commons dost zásadně využívá given name (P735) pro zařazení kategorií, což může být matoucí: Dominik Duka (Q45146) je tedy řazen jako Jaroslav a Václav a ne jako „Dominik“, pod kterýmžto jménem jej bude většina lidí hledat.

Vím že jsem to upravoval např. u Michal František Pometlo (Q92551870), Martin František Vích (Q12035713), Vladimír Benedikt Holota (Q11903570) a Jakub Sadílek (Q92466408) – tj. úprava řeholního jména na řeholní a ponecháno pouze rodné. Nejsem si ale jistý, jaký zde má být obecný princip – někdy bude asi i těžké z věrohodných zdrojů určit, které z daných jmen je rodné a které řeholní. Vím, že to je asi otázka do širší komunity, ale pro jistotu se nejdřív ptám zde. :-) — Draceane talkcontrib. 18:36, 26 March 2021 (UTC)

Dobrá připomínka, ten Christian Martin Pšenička (Q95182166) je ode mně z hromadného importu z Národních autorit. Nevím, kam přesně směřuje otázka. Špatně to určitě je, ale systematické řešení mě nenapadá. Bohužel asi neexistuje databáze moderních řeholníků, jako je http://reholnici.hiu.cas.cz/katalog/clpr54.htm pro ty historické. Určitě špatná rodná jména při opravování neodstraňuj, pokud je tam reference jako v Christian Martin Pšenička (Q95182166), ale místo toho zavrhuj, abych to do té položky v blízké budoucnosti opět roboticky nevrátil, to by byla škoda práce.Vojtěch Dostál (talk) 12:03, 27 March 2021 (UTC)
Jo, já vím, že to je z importu (je jasné, že to ošetřit nejde) a o zavrhování tvrzení jsem již byl poučen. :) Systémově také nevím, jak to řešit – určitě by to znamenalo změnu onoho pojetí na Commons a všude jinde, kde se daná tvrzení přebírají. Co se těch jmen týče, ani netuším, jestli je běžná třeba i praxe, že má toto jméno dotyčný „zapsané v občance“. Pokud ano, jedná se tím pádem asi i o „první jméno“, což mi zas implikuje, že P735 není v češtině asi úplně přesně nazvaná. — Draceane talkcontrib. 13:21, 28 March 2021 (UTC)

@Draceane, Vojtěch Dostál: Naštěstí se řadí primárně podle příjmení, a třeba ten Duka se málokde ocitne mezi tolika jinými Duky, že by nebyl v dohledu od místa, kam by patřil správně. Ale v souvislosti s tím mě napadá, jestli tentýž problém v bleděmodrém nebudeme mít u lidí, kteří místo občanského příjmení užívali umělecký či podobný pseudonym, pod kterým je většina primárně zná, např. Ivan Olbracht nebo soudruh Stalin. A totéž platí i např. pro papeže, protože Benedikta XVI. bude málokdo hledat pod písmenem R. A jestli současní monarchové vůbec nějaká příjmení mají, to ani nevím – spíš to vypadá, že se většinou obejdou bez nich, ale jestli je tomu tak v monarchiích dodnes u všech šlechticů nebo mají přídomek v roli příjmení, to netuším.

Systémové řešení by bylo, kdyby nějakým "vymezením" bylo možno nastavovat, podle čeho se má řadit - tuším, že pro pořadí rodných jmen tu něco takového už máme a funguje to, byť toto jen v rámci jedné vlastnosti. Volitelně či defaultně preferovat řeholní nebo papežské jméno před rodným nebo preferovat pseudonym před občanským příjmením a jménem by zase o tolik složitější být nemělo. --ŠJů (talk) 03:26, 31 March 2021 (UTC)

Státní občanství

Rád bych se zeptal, jaký přístup k vyplňování položky country of citizenship (P27) státního občanství považujete za vhodný. Za příklad uvedu Petr Kellner (Q1395375), u kterého bylo státní občanství dnes vyplněno. Narodil se 20.05.1964 a od narození tedy měl státní občanství Czechoslovak Socialist Republic (Q853348). Dne 01.01.1969 se dosud unitární ČSSR změnila na federaci, pro federaci je na Wikidatech stejná položka. Zároveň však dne 01.01.1969 vznikla Czech Socialist Republic (Q1991965) (současně také Slovak Socialist Republic (Q1751495), což pro nás teď není podstatné). Dne 06.03.1990 byl název změněn na Czech Republic (Q3496079). Československo pak dne 31.12.1992 zaniklo a 01.01.1993 vznikla Česká republika (Czech Republic (Q213)). Problém je s uváděním státního občanství. V současnosti je uvedeno Czechoslovakia (Q33946) od 20. 5. 1964 do 31. 12. 1992, což je za mě dobré řešení, tato položka popisuje Československo v letech 1918 až 1992. Dále je však uvedeno Czech Republic (Q213) od 1992 (?) do 27. 3. 2021. Tato položka popisuje Českou republiku od 01.01.1993. Zároveň však měl od 01.01.1969 státní občanství České socialistické republiky, která byla 06.03.1990 přejmenována na Českou republiky, přičemž jedinou změnou byla změna názvu. Na Wikidatech však máme dvě položky a zde je, dle mého názoru, problém. Mohli bychom napsat, že 26.03.1990 jedno zaniká a 27.03.1990 druhé vzniká, což je dle mého názoru nelogické (když přejmenujeme společnost, také nezanikají funkce a vzápětí nevznikají). Zároveň však nelze zapsat dohromady, neboť pro to zde není položka. Budu proto rád, pokud se vyjádříte, Petr Kellner zde rozhodně není důležitý, je to jen příklad a jde mi o způsob vyplňování státního občanství. --Albert Horáček (talk) 17:50, 29 March 2021 (UTC)

Co se týče státního občanství, řekl bych, že není třeba to jakkoli komplikovat: Do 1992-12-31 byl občanem Czechoslovakia (Q33946), od 1993-01-01 byl občanem Czech Republic (Q213). IIANM neexistovalo státní občanství České socialistické republiky, ani není třeba z hlediska státního občanství rozlišovat různé názvy či ústavní uspořádání jednoho státu. --Mormegil (talk) 18:27, 29 March 2021 (UTC)
Ohledně (ne)existence státního občanství České socialistické republiky musím nesouhlasit, viz čl. 5 odst. 1 ústavního zákona č. 143/1968 Sb., o československé federaci, ve vyhlášeném znění: „Státní občan každé z obou republik je zároveň státním občanem Československé socialistické republiky.“, případně zákon č. 39/1969 Sb., o nabývání a pozbývání státního občanství České socialistické republiky, zejména pak § 1 odst. 1: „Státní občan České socialistické republiky (dále jen "republiky") je zároveň státním občanem Československé socialistické republiky.“
Zároveň však souhlasím s tím, že „není třeba z hlediska státního občanství rozlišovat různé názvy či ústavní uspořádání jednoho státu“, jen zde pak vzniká nelogičnost, kdy bude odkazovaná položka mít jiné časové vymezení (užší), než časové vymezení určitého státního občanství. --Albert Horáček (talk) 19:53, 29 March 2021 (UTC)
Moment, jaktože užší vymezení? Czechoslovakia (Q33946) má (správně) Czechoslovakia (Q33946)inception (P571)1918-10-28, Czechoslovakia (Q33946)dissolved, abolished or demolished date (P576)1992-12-31, což je zcela v souladu, ne? --Mormegil (talk) 20:06, 29 March 2021 (UTC)
Ano, u Československa je to v pořádku. Můj komentář směřoval k občanství České socialistické republiky, resp. České republiky (1990–92). --Albert Horáček (talk) 06:39, 30 March 2021 (UTC)
Proto můj návrh žádné takové tvrzení neobsahoval. :-) Pokud bychom opravdu chtěli rozlišovat občany ČSR a SSR, pak by IMHO dávalo spíš smysl uvádět tedy country of citizenship (P27)Czech Republic (Q213)start time (P580)1969-01-01 (a udělat pořádek v té položce, jak jsme nedávno zmínili v nějaké diskusi na FB…). Ale já bych se do toho fakt nepouštěl; to občanství jednotlivých republik je IMHO spíš ústavněprávní kuriozita než něco užitečně reprezentovatelné v datech… --Mormegil (talk) 07:08, 30 March 2021 (UTC)

Určitě nám v pojetí států vzniká hodně nesrovnatelností, Švýcarsko je formálně konfederací, ale fakticky ho bereme jako unitární stát, naopak Evropská unie je fakticky federací, ale přitom její členy formálně bereme stále jako samostatné státy, podobně je otázka, jak přistupovat ke korunním zemím různých říší, tj. zda to tzv. "občanství" nebo obecnějši "státní příslušnost" vztahovat k říši, nebo k jednotlivým královstvím, markrabstvím, knížectvím atd. a jestli vůbec umíme vždy identifikovat jejich příslušnost k nějaké říši a rozlišit ji např. od pouhé dědičné personální unie. Posuzovat míru jejich samostatnosti či vazalství je velmi ošemetná věc a přístupem dnešních moderních vybarvovačů map či infoboxerů (vyplňovačů infoboxů) může být ta problematika poněkud zploštěna či zkreslena a označovat Čechy či Moravany barokní doby rakouskými vlaječkami mi připadá nestandardnost podobného druhu, jako když se dnes nějaký Čech označuje primárně za občana EU. Navíc obecně vzato o občanství má smysl mluvit až ve vztahu k modernímu občanskému pojetí státu, pro inkolát feudálních šlechticů či poddanství nesvobodných obyvatel by asi bylo vhodné používat nějaký jiný termín, který by nebyl anachronický. Ale ve zjednodušeném světě infoboxů a Wikidat bych tedy jako to občanství bral jen příslušnost k těm státům, které jsou v mainstreamovém pohledu "subjektem mezinárodního práva", v tom je Česká republika přece jen o něco jednodušší případ než různé Hong Kongy, Taiwany, Kosova, Podněstří a podobné špeky, kde realita je často jinde než virtuální právní stav v pojetí té či oné strany. Česká republika nepochybně existuje kontinuálně od 1. ledna 1969 (s jednou změnou názvu) a od počátku byla podle ústavy suverénním státem (paradoxní ovšem je, že až do roku 1992 neměla svoji vlastní ústavu, ale byla ustavena ústavním zákonem jiného státu), subjektem mezinárodního práva se však stala od 1. ledna 1993 (aniž by to mělo zásadní vliv na občanství jejích občanů, těm k tomuto datu pouze zaniklo občanství zanikajícího státu - někteří lidé však své občanství k některé z členských republik federace ani neznali a nevěnovali mu pozornost a pak v roce 1993 si ho museli nechat dodatečně potvrzovat nebo měnit, pokud s ním nebyli spokojeni). Ovšem poté, co kdosi loni na české Wikipedii degradoval a přejmenoval české země na jakési "historické regiony", nejspíš taky pod vlivem wikidatích škatulek, už se nedivím ani tomu, když někdo suverénní státy, členské republiky československé federace, degraduje na jakési gubernie či pseudookresy.

Jinak bych samozřejmě bych také vždy preferoval odkaz na co nejnadčasovější označení toho státu, ne na položky, které se mění s každou novelizací ústavy či s přidáním či ubráním nějakého slova či spojovníku v názvu státu (z tohoto hlediska se mi také příčí rozlišovat v infoboxech, jestli se někdo narodil či zemřel před rakousko-uherským vyrovnáním nebo až po něm). Občanství Československa s "F" ve zkratce je podobná blbost jako občanství páté francouzské republiky. --ŠJů (talk) 02:27, 31 March 2021 (UTC)

Preferované datum narození

Zdravím. U článku cs:Paul Ritter (herec) bych chtěl, aby se v iboxu přebíralo preferované datum. Ale nevím, jak preferenci nastavit v položce Wikidat. --Palu (talk) 12:22, 7 April 2021 (UTC)

Special:MyLanguage/Help:Ranking --Mormegil (talk) 12:47, 7 April 2021 (UTC)
Bohužel z toho nejsem moudrý. Někdo jiný už to udělal, ale pořád nevím, na co kliknul a co kde vyplnil, aby se mu to povedlo. Když kliknu u položky na editovat, tak se mi nic podobného jako zavržené postavení nebo normální postavení neukáže. --Palu (talk) 06:20, 8 April 2021 (UTC)
Aha, přehlídl jsem obrázek - klikne se úplně vlevo na ty šipky. Takže vyřešeno - díky, --Palu (talk) 06:21, 8 April 2021 (UTC)

Sbírky malých muzeí

@Daniel Baránek: naimportoval nějaké muzejní sbírky z vládní databáze, pravděpodobně z Central records of collections (Q11722846). Vytvořil jsem položku muzea Vrbasovo muzeum Ždánice (Q106464831) a koukám, že existuje Q101018919. Má smysl mít samostatné položky pro sbírky takhle malých muzeí? Mohli bychom to sloučit... Vojtěch Dostál (talk) 18:17, 11 April 2021 (UTC)

Já bych to nemixoval. Přece jen se jedná o dvě různé věci (odlišné instance of (P31)). Vadí něčemu, že je to oddělené? --Daniel Baránek (talk) 18:43, 11 April 2021 (UTC)
Dobře, zatím to necháme. Importuji nějaká data z databáze Otevřené sbírky (Q106453269), která vesměs agreguje data dle muzeí jako institucí, ale občas se jim nepodařilo sbírky přiřadit k žádné instituci, tak to tak nechali. Občas jsem tedy vytvořil muzeu samostatnou položku a ve zbylých případech data přiřadím k položkám sbírek. Výhoda je, že collection or exhibition size (P1436) i amount cataloged (P7328) nebudou vyvolávat constraint violations ani u položek institucí, ani u položek sbírek.Vojtěch Dostál (talk) 09:38, 12 April 2021 (UTC)

RÚIAN – ulice

Všiml jsem si takového drobného nešvaru, kde zde máme natažené některé položky osad z RÚIANu, které se ale vydávají za ulice. Chápu, že je problém už ve zdrojových datech, ale asi bychom to měli do budoucna nějak řešit. Naposledy jsem to řešil u položky Háje (Q45774555), vzpomínám si i na Churáňov (Q41089701). — Draceane talkcontrib. 20:12, 27 February 2021 (UTC)

Nešvarem je právě to míchání osad a ulic v položkách WD. Osada má mít svou položku; fakt, že oficiálně existuje ulice, která je věcně v zásadě totožná s tou osadou, je podružná, nemá to být v jedné položce (dají se samozřejmě propojit). Pokud nějaká obec pojmenovává ulice, potřebuje mít pro každý adresní bod definovanou ulici; pokud je adresa v nějaké malé osadě té obce, dává vcelku smysl jako název ulice použít přímo název té osady, ale nic to nemění na tom, že to v tom datovém modelu plní funkci ulice, není to tedy nějaká chyba v datech RÚIANu. --Mormegil (talk) 20:26, 27 February 2021 (UTC)
O tomhle tématu vedeme diskuze už dlouho, typicky Prague (Q1085), která má hromadu instance of (P31) - např. zároveň municipality of the Czech Republic (Q5153359) a district of the Czech Republic (Q548611). Osobně si myslím, že v budoucnu toto budeme muset oddělit, jinak v tom bude chaos jako v tomto případě. Skim (talk) 10:40, 2 March 2021 (UTC)
@Draceane, Mormegil, Skim: Zásadní problém je v tom, že RÚIAN v některých svých výstupech používá pro tu kolonku zjednodušený nadpis "ulice", ačkoliv ve skutečnosti v ní může být název jakéhokoliv veřejného prostranství, tedy nejen ulice, ale i náměstí, návsi, nábřeží, mostu, lávky, ostrova, v řadě případů jsou tímto způsobem pojmenovávány i celé menší čtvrti, sídliště, osady, hradní, obytné, hospodářské či průmyslové areály, samoty a prakticky cokoliv dalšího (v Plzni se 7. září 2006 pokusili tímto způsobem dokonce přejmenovat plzeňský úsek Berounky zpět na Mži, ale v roce 2011 byli donuceni své rozhodnutí zrušit). Když se podíváte do zákona č. 111/2009 Sb., o základních registrech, do § 31 odst. 3 písm. b), tak tam se tento údaj nazývá „ulice nebo jiné veřejné prostranství43) (dále jen „ulice“)“. To "veřejné prostranství" přitom odkazuje na § 34 zákona o obcích (a odpovídající ustanovení zákona o hl. m. Praze), kde je veřejné prostranství definováno jako "všechna náměstí, ulice, tržiště, chodníky, veřejná zeleň, parky a další prostory přístupné každému bez omezení, tedy sloužící obecnému užívání, a to bez ohledu na vlastnictví k tomuto prostoru". Pod což se v běžné interpretaci v aplikační praxi mnohdy vejdou i celé osady, čtvrti či sídliště. Zásadní chyba ovšem je v tom, že RÚIAN tuto legislativní zkratku přebral bez vysvětlivky, a z něj to pak bezmyšlenkovitě přebírají i další zdroje jako Mapy.cz nebo Wikidata. Tedy pokud jsme tuto položku z RÚIAN importovali kompletně jak leží a běží, tak jsme neměli automaticky předpokládat, že ten název je vždy názvem ulice. Nejde o "osadu, která je věcně v zásadě totožná s tou osadou", ale o pojmenování té osady formou určitého typu adresního údaje, tedy de facto zároveň o určitý evidenční status té osady (tak jako může být de iure částí obce, ZSJ nebo katastrálním územím, tak může být i "ulicí"). Bohužel nám tu ve Wikidatech vznikají případy, kdy stejný park, ostrov atd. tu máme dvojmo, jednou jako park či ostrov a podruhé jako pseudoulici, ačkoliv ten tzv. "název ulice" od počátku byl fakticky i právně pojmenováním právě toho parku, nejen nějaké cestičky v parku nebo vozovky podél parku. Ale všichni jsou celkem zvyklí, že kvůli zjednodušení se tomu ve formulářích říká "ulice", i když to může být náměstí, park nebo čtvrť. Jen je třeba si toho být vědom při interpretaci těch výstupů, že to slovo "ulice" je zde jen takovou technickou zkratkou a vůbec nemusí znamenat skutečnou ulici. (Datoví architekti RÚIAN se ovšem při aplikaci zákona dopustili zásadního lapsu v tom, že umožňují ulici definovat pouze jako lineární objekt, byť i nesouvislý a větvený, a ne jako plošný objekt, což by bylo užitečné i pro ty skutečné ulice.) Na ČÚZK mi přislíbili, že se těmi problémy budou zabývat, ale to zcela určitě nejde ze dne na den, to je spíš námět pro případnou tvorbu zcela nového systému někdy v budoucnu. Což nám připomíná, že podle zákona už od roku 2007 má existovat také Centrální evidence pozemních komunikací, ale ani jeden z ministrů dopravy za posledních 13 let dosud nedokázal tuto povinnost státu naplnit (pouze za to zatím utratili tři miliony), a nynější pan multiministr nevypadá, že by se k tomu v dohledné době chystal. Natož aby byl schopný zajistit kompatibilitu této evidence s evidencí RÚIAN nebo s evidencí účelových komunikací, stezek a pěšin v extravilánu, kterou jsou zase léta letoucí povinny vést obce podle zákona o ochraně přírody, a většina z nich to buď nedělá vůbec, nebo to má někde nedostupné v šuplíku, nebo to mají zpracované způsobem, který není kompatibilní vůbec s ničím, a nekoordinuje to nikdo. Prostě koho si volíme, takovou máme kvalitu veřejné správy.
Některé typy by šly nějak aspoň nahrubo rozlišit algoritmicky podle názvu (např. pokud název obsahuje řetězce jako "nábřeží", "náměstí", "park", "ostrov", "náves", pak nejde o ulici), ale na druhou stranu je zase praktické mít pro tento typ adresního údaje jednu společnou vlastnost, tedy spíš by dávalo smysl rozšířit název (label) té vlastnosti located on street (P669) nebo aspoň ten její dodatečný vysvětlující popis, který nyní zmiňuje i náměstí, ale ne ty další možnosti.
Pokud bychom to rozdělili na spoustu různých vlastností podle typu veřejného prostranství, tak bychom tím prakticky znemožnili práci všem algoritmům a skriptům, které pracují s adresami, protože tento adresní údaj by se nám roztříštil na mnoho různých vlastností, a zároveň bychom si nikdy nebyli jisti, jestli v konkrétním případě ta vlastnost skutečně vyjadřuje oficiální adresní údaj. Asi by to bylo lépe řešit spíš tím, že taková položka bude označena souběžně jako tzv. "ulice" (ve smyslu že jde o oficiální adresní údaj této úrovně), a souběžně další hodnotou vyjadřující typ daného místa (náměstí, most, osada, samota, hradní areál, kopec, park, ostrov…). Ty údaje importované z RÚIAN neměly ve vlastnosti instance of (P31) mít hodnotu street (Q79007), ale nějakou jinou, vyjadřující tento speciální význam adresního údaje. --ŠJů (talk) 21:34, 21 March 2021 (UTC)
@ŠJů:Ahoj. Tohle je pro me nova informace. Diky za to. Tohle je na promysleni, jak vsechny ty vazby vlastne funguji (pro me). Obecne bychom meli zacit v diskuzi Property talk:P4533, protoze je spatne uz ten nazev vlastnosti (pokud to chapu dobre). Skim (talk) 15:28, 22 March 2021 (UTC)
Proboha, když je někde kolonka "ulice", tak se tam vyplňuje klidně i nábřeží nebo náves - hlavně že to je tento typ adresního údaje. Ulice v nejběžnějším, širokém slova smyslu je tedy vše co má Czech street ID (P4533) a basta Vojtěch Dostál (talk) 15:33, 22 March 2021 (UTC)
Jenže pak se najde někdo, kdo nepochopil, že pokud je do RÚIAN do kolonky "ulice" zapsán třeba park, tak je to prostě kód a název toho parku, nikoliv například několika obtažených stezek v tom parku anebo vozovky na hranici parku, jak se to v RÚIAN schématicky naznačuje. A pak se stane, že to pro jeden a tentýž park máme třeba čtyři položky. --ŠJů (talk) 04:14, 31 March 2021 (UTC)
Nevím, osobně mi to přijde jako přepjatý formalismus a umělé udržování chyb z RUIANu při životě. Analogicky by mi přišlo, jako bychom na Wikipedii psali, že Charles IV (Q155669) zemřel roku 1738, protože v literatuře měli překlep a my lpíme na zdrojích... — Draceane talkcontrib. 21:05, 12 April 2021 (UTC)
Ony to nejsou ani tak chyby z RÚIANu, jako spíš neschopnost data RÚIANu správně interpretovat. I když je možno považovat za chybu RÚIANu, že není zcela blbovzdorný a používá v názvu položky bez patřičné polopatické vysvětlivky legislativní zkratku, a nepočítá s tím, že by někdo sám nepochopil, že park, ostrov nebo náměstí nejsou ulice, i když se uvádějí v kolonce "ulice". --ŠJů (talk) 17:43, 22 April 2021 (UTC)

Plán importů

Občas někdo do Wikidat hromadně importuje nějaké údaje (ulice z RÚIAN, kulturní památky, drobné památky z několika databází památek, vodoteče či rybníky z nějakých vodohospodářských evidencí, Lsjbot nám to tu zamořil dost nekvalitními daty z Geonames atd.), ale ostatní si toho většinou všimnou až poté, když je hotovo, a případné chyby nebo nedomyšlenosti se pak dodatečně hůře upravují. Třeba u těch ulic se nepomyslelo na to, že položka "ulice" v RÚIAN obsahuje kromě ulic i náměstí, parky atd., ta vodohospodářská evidence má zase velmi často u rybníků uvedenou naprosto chybnou příslušnost k obcím atd., příslušnost k obcím by bylo vhodné u bodových objektů podle souřadnic roboticky nahradit příslušností k části obce atd.

Neměli bychom si tady někde na Wikidatech zřídit nějaké centrální místo, kde by byl každý takový hromadný import předem avizován a mohli bychom předem připomínkovat, jaká je kvalita a struktura těch dat, jak ta data předem nebo dodatečně systematicky pročistit, v jaké podobě generovat popisy, jak kódovat či transformovat klíčové vlastnosti, potom sledovat průběh toho importu atd.?

Zároveň by bylo možné shromažďovat různé nápady, co ještě by bylo možné importovat, a domlouvat se, jestli k tomu dozrál čas nebo jestli je to vůbec dobrý nápad (poslední dobou mi tu kvůli vlastnostem mostů chybí například silnice III. třídy, které by se daly importovat z OSM, z dalších objektů mě výhledově napadají třeba právě mosty, železniční přejezdy, zastávky, sídla obecních úřadů, případně kompletně adresní body provázané s budovami atd.). A třeba se jednou dočkáme i toho, že objekty tu bude možno lokalizovat nejen definičním bodem, ale i linií nebo polygonem. Samozřejmě v souvislosti s ještě masivnějšími importy je třeba také zvážit takové nastavení mobilní aplikace Commons, aby se tam daly evidované objekty filtrovat podle typu a podle důležitosti atd. (aby se např. nestalo, že zobrazením definičních bodů všech ulic jsou "zastíněny" drobné památky) a aby výstupy (uploady) z té aplikace měly patřičnou kvalitu a relevantní popisy, s čímž zatím byly dost velké problémy.

Zatím se mi zdá, že každý ty hromadné importy dělá buď úplně na vlastní pěst, nebo že si to domlouvají nějaké skupiny někde bokem. Samozřejmě nikomu nechci do jeho snah házet vidle, je to ohromný objem užitečné práce, ale ocenil bych tu nějakou nástěnku, kde by bylo přehledně vidět, kdo na čem zrovna pracuje a k čemu se kdo chystá. Nebo už někde taková platforma existuje, jenom tady na ni chybí odkaz? --ŠJů (talk) 03:06, 31 March 2021 (UTC)

Bylo by to hezké, ale: 1) každý chce aby ho především ta práce bavila a to často není slučitelné s dlouhým diskutováním, 2) obdržený feedback je často nekvalitní nebo příliš idealistický. Občas nějaké složitější diskutuji v naší Facebookové skupině - to je přeci jen uživatelsky přátelštější prostředí - ale rozumím že to nepotěší ty, kteří Facebook nepoužívají. Jinak pár komentářů k tvým nápadům (ale dále se mi o tom diskutovat nechce): s ulicovým názorem se neztotožňuji, jak víš, obce rozhodně nenahrazovat částmi obcí (maximálně je doplňovat a nastavovat jim vyšší rank), z OSM importovat z licenčních důvodů nelze, a aplikace Commons filtrovat na typy už umí.Vojtěch Dostál (talk) 19:00, 1 April 2021 (UTC)
Ale minimálně by nebylo špatné mít stránku, kde by se uvedlo
  • import z NKČR v období XY, cca 100000 položek
  • import z drobnepamatky.cz, jaro 2020, cca 40000 položek.
  • ...
Protože se pak člověk až diví, na co naráží, případně mu unikne nějaký import, který by jej zajímal. JAn Dudík (talk) 17:52, 4 April 2021 (UTC)
@Vojtěch Dostál: K tomu stanovisku "obce rozhodně nenahrazovat částmi obcí (maximálně je doplňovat a nastavovat jim vyšší rank)" - to je ovšem proti logice P131, kde se z principu má uvádět nejnižší možná administrativní jednotka, ne tam vyjmenovat celou hierarchii a ještě to nějak rankovat (v poznámce k použití vlastnosti se to přímo uvádí: "Stačí vyplnit administrativní jednotku nejnižší vyšší úrovně, ujistěte se však, že i tato jednotka má řádně vyplněnu vlastnost P131"). Nicméně kdysi jsem navrhoval, aby existovala přímo vlastnost "obec", jejíž hodnota by byla pro položku přímo dostupná, aniž by ji nějaký algoritmus musel pokaždé znovu dopočítávat (a taková funkce ani není jednoduše dostupná), ale bylo to zamítnuto, že prý by to byla redundance. Na druhou stranu u spousty položek si dialog vynucuje vlastnost P17 "stát", a když někdo navrhoval její zrušení, protože příslušnost ke státu lze u lokalizovatelných objektů přece také dopočítat z té posloupnosti P131 od nejnižší úrovně, tak to bylo kupodivu také zamítnuto. Holt prostě Wikidata jsou jeden velký nestrukturovaný chaos bez logiky a koncepce. A když pak někdo nerespektuje ani ty principy, které jsou jasně dané… --ŠJů (talk) 17:37, 22 April 2021 (UTC)

Troja a Praha-Troja

Hezký den, uměl by třeba @Harold: nebo kdokoliv jiný rozmotat zacyklované administrativní jednotky v Praze? Konkrétně: Praha-Troja (Q2643835)located in the administrative territorial entity (P131) Troja (Q84682501) a naopak. Platí však ale myslím jen jedno, jinak by to nedávalo smysl. Co je územně nadřazenější? Vojtěch Dostál (talk) 12:40, 16 April 2021 (UTC)

No je v tom asi binec. Obecně vzato IMHO ani jedno, viz cs:Skladebnost územního členění#Katastrální území/část obce a městská část nebo městský obvod. Takže by se prima facie zdálo, že Praha-Troja (Q2643835) je dělením Prahy (městská část/městský obvod), Troja (Q84682501) je také (jiným) dělením Prahy (část obce, ale současně také katastrální území, které zde máme sloučené). Jenže aby to nebylo tak jednoduché, tak současně tvrdíme, že Troja (Q84682501) je administrative division of Prague (Q585444), což je specifická třída právě pro self-governing city part in the Czech Republic (Q21851888)! Takže někde je něco špatně. Jestliže cs:Troja tvrdí, že „Praha-Troja je městská část tvořená větší částí katastrálního území Troja.“, tak se zdá, že totožné nejsou, mělo by se tedy instance of (P31)administrative division of Prague (Q585444) přesunout z Troja (Q84682501) na Praha-Troja (Q2643835). Asi. --Mormegil (talk) 12:58, 16 April 2021 (UTC)
Udělal jsem na tu skladebnost dotaz a na nějaké chyby to tam vypadá. --Mormegil (talk) 13:28, 16 April 2021 (UTC)
Před rokem jsem se v částech Prahy snažil v souvislosti s doplňováním historických počtů obyvatel udělat trochu pořádek, tak jsem založil nějaké chybějících položek a části obce/katastrální území (berme teď zjednodušeně, že jde o totožné entity = jednu položku) jednotným způsobem propojit s "nadřazenými" položkami městských částí a obou typů existujících obvodů. Čili loni na jaře byla celá Praha v tomto směru unifikovaná (a stejným způsobem i Brno), ale jestli to někdo od té doby někdo někde změnil a třeba naboural stávající systém, to už nesleduju. Dívám se, že v případě Troji šlo o tuto pozdější editaci. --Harold (talk) 15:40, 16 April 2021 (UTC) A k administrative division of Prague (Q585444): tam zas mezitím proběhl významový posun. Wikičlánek a kategorie na Commons (a třeba i anglický popis položky) mají charakter jakéhosi obecného přehledového článku/kategorie, který se věnuje různým typům členění Prahy a jeho historii. Nedávno zde ale najednou došlo k extrémnímu zúžení významu položky jen na self-governing city part in the Czech Republic (Q21851888). --Harold (talk) 15:48, 16 April 2021 (UTC)

Zrušil jsem ŠJůovu editaci, protože zacyklované P131 dělají vážné problémy při dotazování do Wikidat. @ŠJů:. Vojtěch Dostál (talk) 13:11, 22 April 2021 (UTC)

Pořád to není rozmotané. Asi před půl rokem jsem se pokoušel správně rozlišovat přesně vymezené (a mající příslušnou RÚIAN vlastnost) administrative district of Prague (Q74728036), municipal district of Prague (Q75339006), municipal part of Prague (Q75338598) (a cadastral area in the Czech Republic (Q20871353)), nepoužívat vágní administrative division of Prague (Q585444). Ale vzniká tam problém, jak se zachovat, když se tyto zcela překrývají. Tam mi přišlo lepší mít na to pro přehlednost jen jednu položku (na wiki je v takovém případě samozřejmě vždy jen jeden článek), ale min. v případě překryvu municipal part of Prague (Q75338598) a cadastral area in the Czech Republic (Q20871353) to občas působí zvláštně. A když se nepřekrývá a jsou třeba samostatné položky, tak správně používat Prague 5 (Q577602), Prague 5 (Q84492217) a Prague 5 (Q84492219) neumí prakticky nikdo.--Jklamo (talk) 15:52, 22 April 2021 (UTC)

@Vojtěch Dostál, Harold, Mormegil: V tomto případě nepochybně městská část Praha-Troja je celá součástí evidenční a katastrální části Troja (v Praze jsou ze zákona katastrální území zároveň evidenčními částmi obce), zatímco evidenční a katastrální část Troja spadá do samosprávné městské části Praha-Troja jen částečně. Kdo to nevěděl, mohl se to dozvědět nahlédnutím do těch článků, které to polopatě vysvětlovaly (pokud ty články mezitím někdo nevybrakoval), nebo to během tří vteřin zjistit třeba přes mapy.cz.
Ovšem pokud jsem si všiml, tak například u chráněných území se zcela běžně používá P131 i pro vyjádření vztahu, že subjekt někam spadá jen částečně (pokud např. chráněné území zasahuje do tří obcí, tak se u něj uvede P131 se třemi hodnotami). Čili nejspíš není primární bordel v datech, ale v definicích vlastností a pravidlech pro jejich používání. Troja je rozdělena do dvou městských částí, a to Praha-Troja a Praha 8 - pokud pro takovou částečnou příslušnost máme nějaký qualifier nebo speciální vlastnost, měly by být použity, ale pokud je mi známo, dosud se v mnoha případech používá P131 právě takto. Pokud si s tím nějaké nástroje neumějí poradit a jeví se jim to jako zacyklení, tak pak je určitě třeba dát přednost těm případům, kdy P131 vyjadřuje plnou příslušnost, před případy, kdy vyjadřuje částečnou příslučnost – tedy přesně naopak, než jak to nyní v případě Troji Vojta v rámci pokusu o nápravu udělal. Ovšem primární chyba je v tom, že není vyjasněné, jestli P131 lze používat i pro částečnou příslušnost - pokud ano, tak potom samozřejmě není možné považovat za zacyklení, pokud na sebe dvě položky navzájem touto vlastností odkazují. Pokud se P131 pro částečnou příslušnost používat nemá, tak budeme muset opravit tisíce položek, kde se tak používá.
V případě Prahy by metodicky čisté bylo založit jako mezistupeň položky pro díly části obce. S tím jsem zatím experimentoval v případě Vinohrad (které jsou rozděleny do 5 městských částí) - viz např. Q105064071, ostatně mám pocit, že jsem to zmiňoval v nějaké diskusi, kde mj. Vojta byl přítomen. Prozatím jsem ovšem skončil na tom, že pro tyto díly nelze použít Czech neighbourhood ID code (P2788), protože ta generuje odkaz do RÚIAN, avšak díly se v RÚIAN neevidují a museli bychom mít vlastnost, která místo toho odkazuje do RSO. Ovšem do byrokracie spojené s žádostí o zavedení nové vlastnosti (nebo s rozšířením významu a použití stávající vlastnosti) jsem zatím neměl čas se pouštět. Pokud někdo má čas a chuť něco řešit, zde má příležitost se realizovat.
Co se týče zmatku v položkách vyplývajícího z toho, že na Wikipedii máme společné články pro některé městské části a zároveň pro jejich "jádrové/sídelní" čtvrtě, zatím jsem se ho (kolem 20. března) pokusil - snad úspěšně - vyřešit u velkých (číslovaných) městských částí, kde to působilo největší problémy, což byla Praha 16 vs. Radotín, Praha 17 vs. Řepy, Praha 18 vs. Letňany, Praha 19 vs. Kbely, Praha 20 vs. Horní Počernice, Praha 21 vs. Újezd nad Lesy, kde samosprávná městská část je sice územně totožná se "čtvrtí", ale má odlišný název a label. Výhledově bych se chystal řešit právě případy "malých" městských částí, kdy území městské části není totožné s územím čtvrti s podobným/zaměnitelným názvem (právě u té Troji máme nyní zásadní bordel v labelech, kdy Praha-Troja (Q2643835) má ve dvou jazycích label pro městskou část Praha-Troja a v ostatních jazycích label pro katastrální/evidenční část Troja – jinými slovy, to rozdělení na dvě položky nebylo co se týče labelů dotaženo do konce, a tím spíše předpokládám, že nebyly systematicky opraveny ani odkazy ze všech ostatních položek). A až úplně nakonec nám pak zbudou ty malé městské části, které jsou tvořeny jedinou evidenční/katastrální částí a de facto se pro oba významy liší pouze label (statistické údaje by měly být pro oba významy shodné).
Samozřejmě naflákat třicet či kolik nových položek do Wikidat by bylo možné během chvilky (možná už to někdo v části případů dokonce udělal), ale pokud se to má dělat pořádně, tj. zároveň opravit labely rozdvojených položek, v případě neskladebnosti dotvořit položky pro díly, opravit odkazy ze všech ostatních položek tak, aby vždy směřovaly na nejbližší nadřazenou územní jednotku, a pokud možno to koordinovat s odpovídajícím rozdělením článků na Wikipedii, tak je to spíš mravenčí práce kus po kusu. U těch jednodušších případů, kde je zachována skladebnost, jde v zásadě o stejný problém jako v případě oddělení článků o obci od článku o jádrové části obce, což je také úkol spíše na desetiletí než na počkání.
Pokud chceme najít nějakou jednoznačnou chybu, která, jak je zřejmé výše, zmátla například Mormegila, tak takovou chybou je, že k tématu administrative division of Prague (Q585444) někdo v prosinci 2020 v rámci trochu chaotického sledu editací uvedl nakonec jako nadtřídu self-governing city part in the Czech Republic (Q21851888), což je samozřejmě nesmysl, protože ten článek a ta položka se týká všech typů členění Prahy a ta položka rozhodně nikdy nebyla určena k tomu, aby označovala jeden konkrétní typ jednotky územního členění Prahy. Ovšem vzhledem k tomu, že Mormegilovo vyjádření z tohoto omylu vychází, tak z větší části ztrácí relevanci. Snad by bylo lépe, kdyby se lidé do diskuse zapojovali až poté, co se s problematikou trochu obeznámí. --ŠJů (talk) 16:30, 22 April 2021 (UTC)

Vložení infoboxu do stránky s jiným názvem

Prosím o radu, jak (a jestli vůbec) lze vložit infobox s daty z Wikidat do článku s jiným názvem. Konkrétně bych chtěl vložit infobox o JPEG XL Reference Software pomocí šablony Infobox - software do stránky JPEG XL. Nepodařilo se mi nikde najít, jak to udělat. --Avayak (talk) 12:15, 20 April 2021 (UTC)

To musí podporovat příslušný infobox; konkrétně cs:Šablona:Infobox - software to IIANM momentálně nepodporuje, takže bez jeho úpravy to momentálně nejde. --Mormegil (talk) 13:22, 20 April 2021 (UTC)

Česká periodika

Naimportoval jsem nějaká data k existujícím cca 600 českým periodikům z Database of periodicals for the public (Q106446694), např. zde. Dávám k diskuzi, co s těmi zbývajícími 15000 periodiky, které jsou v databázi, ale ve Wikidatech je zatím zřejmě nemáme. Jak moc se na takovou "vládní" databázi uplatní např. právo pořizovatele databáze? Vojtěch Dostál (talk) 13:07, 22 April 2021 (UTC)

Bohužel, na https://data.gov.cz/poskytovatel%C3%A9 toho má Ministersto kultury "hodně" a https://data.mkcr.cz/homepage/folder?folder_id=ff75534d-4c16-4d5d-9472-59c5d476fd85 už nikdo pár let neviděl. Tedy typická šedá zóna.--Jklamo (talk) 16:18, 22 April 2021 (UTC)

Multiintervalová hodnota

Ahoj vespolek! Chtěl jsem u Jarmila Kubíková (Q95165306) vložit období jejího zaměstnání, ale problém je, že byla zaměstnána, vyhozena komunisty a po revoluci zaměstnána podruhé. Když zkouším vložit obě období do jedné hodnoty (1959-1971 a 1990-1998) jako start time-end time, start time-end time, hlásí to chybu, protože to systém nepobere. Jak to tedy udělat správně? Vložit k employer (P108) dvě hodnoty Department of Botany (Q86738646) a u každé dát jiný interval? --GeXeS (talk) 08:11, 30 May 2021 (UTC)

Ano, přesně tak. --Mormegil (talk) 08:46, 30 May 2021 (UTC)

Nové vlastnosti

Zdravím, dávalo by smysl založit vlastnosti pro databáze Musicbase a Český hudební slovník osob a institucí a následně propojit databázové položky s WD? — Draceane talkcontrib. 12:46, 1 July 2021 (UTC)

Ta druhá je Český hudební slovník osob a institucí ID (P8482). --Matěj Suchánek (talk) 15:39, 1 July 2021 (UTC)
A což Czechmusic.net? (byly by potřeba vlastnosti pro skupiny (1650k s), lidi (6140) a případně nahrávky (6960)). JAn Dudík (talk) 12:55, 8 July 2021 (UTC)
Zatím jsem zkusil navrhnout svou první vlastnost (PLADIAS – k českým „kytkám“), tak uvidím, jak proběhne proces a pak zkusím třeba i něco dalšího. Vůbec ale netuším, jestli se pak někde žádá o bota na propojení. Ještě jsem koukal, že by možná stálo za to založit i vlastnosti pro Čtení z Písku (vlastně písecká literární encyklopedie) a Encyklopedii Prahy 2 (ta tedy mimochodem dost obsahu přebírá z cswiki). — Draceane talkcontrib. 19:22, 8 July 2021 (UTC)
@Draceane: Díky za založení proposalu. Mám tam jeden nápad. Co se týče propojování, boti sami to nezvládnou - je potřeba vzít export z databáze Pladias, kouknout se, jaké taxony vlastně evidují, a nějak to spárovat s taxony ve Wikidatech. Je to netriviální úkon, ale na druhou stranu to není nic, co by se nedalo zvládnout. Vojtěch Dostál (talk) 07:45, 9 July 2021 (UTC)

Jedinečná hodnota u P762 a P4075?

Díval jsem se, že vlastnosti Czech cultural heritage ID (P762) a Czech Monument Catalogue Number (P4075) mají distinct-values constraint (Q21502410) s uvedením některých výjimek. Z hlediska definice položek v PK, které jsou často souborné a odporují tak datovému modelu, který je nastaven na WD, by mi přišlo vhodnější nějaké systematičtější řešení. Pak to akorát hází „blesky“ v jinak bezproblémových položkách, např. zde Church of Saint George (Q37319258). — Draceane talkcontrib. 13:54, 5 May 2021 (UTC)

Kulturní památka je vždy jen jedna položka, ta nese Czech cultural heritage ID (P762) a vždy také jednomu Czech Monument Catalogue Number (P4075) odpovídá jedna položka (někdy ovšem jedna kulturní památka může mít více částí a ty mají přiřazené vlastní Czech Monument Catalogue Number (P4075), ale vždy s unikátní hodnotou). Zatím jsem za ta léta nenarazil na případ, že by se z logiky věci *musel* nějaký identifikátor vložit do dvou položek. Zde je evidentně památkou soubor několika objektů ("Kostel sv. Jiří a zaniklá ves Aldašín") a tak je myslím potřeba vytvořit samostatnou položku pro tuto památku a do ní identifikátory přesunout...Vojtěch Dostál (talk) 17:17, 5 May 2021 (UTC)
@Draceane, Vojtěch Dostál: Občas vznikají nejednoznačnosti, pokud například tatáž položka původně znamenala kostel (s příslušenstvím / s areálem), ale pak je stejný název použit i pro holý kostel, popřípadě se tluče pojetí, jestli kostel je součástí areálu hřbitova nebo naopak hřbitov příslušenstvím kostela, tj. není jednoznačné, který z těch pojmů je nadřazený druhému (totéž může platit pro vztah Místodržitelského letohrádku a Královské obory apod.). Mohlo to být například v MonumNetu pojaté jedním způsobem a do Památkového katalogu přepsané v tom opačném pojetí. Pak nezbývá, než prostě jednu z těch dvou možností zvolit. Ale pokud máme KP "kostel včetně křížku u vchodu" a navíc ještě katalogové číslo pro "kostel bez křížku u vchodu", ne vždy bych se hned hrnul do toho, aby byla pro každý význam jiná položka. To bych spíš křížek pojal jako součást kostela, a ty dva významy (kostel s křížkem a kostel bez křížku) bych nechal splývat v jedné položce. Případ, kdy "kostel je jediným viditelným pozůstatkem původní středověké vsi Aldašín" a památka zapsaná původně pod názvem "kostel sv. Jiří" se postupně nenápadně změnila název na "kostel sv. Jiří a zaniklá ves Aldašín", aniž by se fakticky rozsah a popis chráněného objektu změnil, bude trochu podobný případ. Za "bezproblémovou" bych zrovna tuhle položku asi neoznačil a chápu, že položka pro ves Aldašín a položka pro kostel pak mohou oba plnohodnotně odkazovat na totéž rejstříkové i katalogové číslo - a je vlastně na našem náhodném rozhodnutí, kterou z těch položek my nadřadíme té druhé. --ŠJů (talk) 20:10, 24 July 2021 (UTC)

Příspěvkové organizace

Zdravím. Vyčlenil jsem z public-benefit corporation (Q78443472) (public-benefit corporation) český a slovenský článek Příspěvková organizace a založil pro ně novou položku contributory organization (Q107037041), protože jde obsahem i názvem zřetelně o značně odlišný pojem než je popisován v odkazovaném článku na anglické Wikipedii. Ovšem problém bude asi v tom, pokud někdo odkaz na tuto položku používal jako odkaz na českou právní formu právnické osoby, pro kterou je určena starší specifická položka contributory organization (Q7257282) - to by se pak muselo hromadně dohledat a opravit.

Je otázka, jestli se v jiných zemích dá najít nějaká právní forma, která by co nejpřesněji odpovídala našim příspěvkovým organizacím. Polský článek pl:Przedsiębiorstwo użyteczności publicznej není psán dostatečně jasně, abych z něj poznal, zda se také jedná pouze o organizace zřízené veřejnou správou, jako je tomu u našich příspěvkových organizací.

Co se týče obecně prospěšných společností, pro českou právní formu máme obecně prospěšná společnost (Q12041908) a vedle toho máme nadnárodní položky public benefit organization (Q7257704) (public benefit organization) a public-benefit corporation (Q78443472) (public benefit corporation), u nichž bych si nebyl jistý, zda v angličtině je rozdíl natolik jednoznačný, aby u všech připojených odkazů z jiných jazyků bylo možno spolehlivě určit, ke kterému z nich mají být přiřazeny. --ŠJů (talk) 00:31, 31 May 2021 (UTC)

Pro právní formy ve specifickém státě jsou určitě lepší samostatné položky, použití obecné položky je jen "nouzovka".--Jklamo (talk) 11:44, 17 July 2021 (UTC)

Části Prahy

Vytvořil jsem údržbový přehled ke členění Prahy - User:Jklamo/Praha - a je tam zdá se práce jak na kostele.

Související otázkou také je, co (všechno) v rámci Prahy používat pro located in the administrative territorial entity (P131). cadastral area in the Czech Republic (Q20871353) je myslím asi celkem jasné, z ničeho jiného se nedá odvodit a je na něj vázáno např. conscription number (P4856). Co ovšem u municipal part of Prague (Q75338598), administrative district of Prague (Q74728036) a municipal district of Prague (Q75339006)? Používat všechny 3 mi přijde zbytečně komplikované. Dává mi smysl používat municipal part of Prague (Q75338598), když to ostatní by pak mělo být odvoditelné. Na druhou stranu, adresa by podle příslušné vyhlášky vycházet z municipal district of Prague (Q75339006). --Jklamo (talk) 12:14, 17 July 2021 (UTC)

Moc nerozumím otázce :) Nebál bych se jít do co největší hloubky, tj. do P131 dávat klidně ZSJ :) Pokud je vyplněno katastrální území, které je ve více obvodech, pak vkládám obojí, aby byl průnik množin co nejmenší a určení místa co nejpřesnější.--Ben Skála (talk) 10:28, 19 July 2021 (UTC)
@Jklamo: Obecně jako nejnižší administrativní jednotku (tedy P131) používáme "část obce" (tedy evidenční část ve smyslu zákona o obcích). Nižší urbanistické nebo statistické jednotky už nejsou vyloženě administrativní a používáme pro ně spíše location (P276), a katastrální členění obecně ve Wikipedii, Commons a Wikidatech systematicky nepodporujeme a nebyly pro ně plošně zakládány položky ani články (v Praze nás ta "katastrální území" zajímají proto, že plní ze zákona funkci evidenčních částí obce). Popisné nebo evidenční číslo obecně není vázáno na katastrální území, ale právě na evidenční část obce ("konskripční osadu"), byť v některých obcích (včetně Prahy) se může evidenční členění shodovat s katastrálním. V Příbrami nebo v Čerčanech to tak ale platit nemusí.
Pokud evidenční členění statutárního nebo hlavního města není skladebné se samosprávným členěním, pak zpravidla používáme paralelně jak údaj o evidenční příslušnosti, tak údaj o samosprávné příslušnosti - metodicky čistší řešení je založit položky pro díly části obce, jak jsem navrhoval tuším tady o pár oddílů výše a na několika případech pilotně vyzkoušel - např. State Opera Prague (Q1886083) v dílu Q105064071- haprují nám tam jen odkazy do RÚIAN, protože díly jsou uvedeny jen v RSO a ne v RÚIAN, a na tom jsem se zasekl. Každopádně samosprávné členění statutárních měst bych považoval za doplňkové a druhotné - primární z hlediska adres i z hlediska Wikipedie je evidenční členění obcí, které je uplatnitelné na všechny obce a jakékoliv místo v ČR. Za standardní hodnotu P131 bych považoval část obce (pokud je plně skladebná do samosprávného celku) nebo díl části obce (pokud je část obce rozdělena do více samosprávných MČ nebo MO) nebo evidenčně nečleněnou obec, všechny vyšší územní jednotky by z toho měly být odvoditelné. Samosprávné městské části jsou v případě Prahy plně skladebné do městských obvodů, tak jako obce jsou skladebné do okresů. Tzv. správní obvody Prahy (správní obvody přenesené působnosti 22 "velkých" městských částí) bych do hierarchie P131 snad zatím radši ani nezatahoval. Obce taky, pokud vím, zpravidla řadíme rovnou do okresů, a správní obvody PO a ORP v hierarchii P131 vynecháváme.
Bohužel definice located in the administrative territorial entity (P131) není jednoznačná, takže souběžné uvedení více hodnot se používá jak v případě, kdy subjekt položky zasahuje do více sousedících administrativních území (typické pro chráněná území nebo hraniční mosty), tak v případě, kdy subjekt položky leží v průniku dvou územních jednotek různého typu členění. Infoboxy a jiné výstupy s tím ne vždy umějí zacházet - některé zobrazují jen první hodnotu (bez ohledu na qualifiery), a ani ty ostatní nemohou poznat, kdy má jít o "sjednocení" a kdy o "průnik".
Nevím přesně, co jste myslel tou "prací jak na kostele" - práce bude samozřejmě vždycky všude plno, ale v případě Prahy snad tu základní hierarchii už máme zohledněnou. Pokud nám tam nějaká úroveň chybí, dá se to napravit 57 nebo 112 editacemi. Zbývá ještě zkontrolovat ty malé samosprávné "městské části", které se skládají z více evidenčních částí nebo se s nimi přesně územně nekryjí, jestli máme na Wikidatech jednoznačně rozlišenou položku pro evidenční část od položky pro samosprávnou část. Tam, kde je samosprávná část tvořená právě jednou evidenční částí, nám zůstává problém, že se formálně liší jejich název, nelze mít v jednom labelu oba názvy současně. Tj. je otázka, jestli už z toho důvodu nemít také pro každý význam samostatnou položku, byť by se vztahovaly k totožnému území. --ŠJů (talk) 19:19, 24 July 2021 (UTC)

Silnice III. tříd

Dokázal by sem někdo z OSM importovat seznam českých silnic III. tříd, aspoň v nějaké jednoduché podobě? Články na Wikipedii silnicím III. tříd zatím na Wikipedii nezakládáme, ale položka Wikidat by se hodila jednak kvůli vlastnostem (zejména mostů, případně i vesnic apod.), jednak kvůli tomu, aby na ně bylo možno navázat kategorie silnic v Commons. Rád bych se pustil do systematického zakládání položek pro mosty, které mají v Commons svoji kategorii či fotku, a bylo by praktické, kdybych z jedné vody načisto už mosty mohl přiřadit i k silnicím, aby se k tomu pak nebylo nutno vracet. --ŠJů (talk) 19:52, 24 July 2021 (UTC)

Z OSM na Wikidata importovat nelze kvůli odlišným licencím. --Mormegil (talk) 07:53, 25 July 2021 (UTC)
@Mormegil: Díky za info. Nezbývá tedy než čekat, že někdy možná nakonec něco vypadne z ŘSD, až se ministerstvo probere a vydá prováděcí vyhlášku k zavedení Centrální evidence pozemních komunikací, pokud nebude přísně tajná. --ŠJů (talk) 15:01, 11 August 2021 (UTC)

Smazat identifikátor Bibliografie dějin Českých zemí?

Hezký den, po určitou přechodnou dobu tu máme jak původní P6656 (P6656), tak nové BHCL UUID (P9037). Z mého pohledu asi nemá význam tu oba mít, zvlášť když neexistují nyní žádné položky, které by měly starý identifikátor, ale neměly nový. Navrhuji tedy označit vlastnost za zastaralou, vyprázdnit ji a posléze smazat. Má s tímto rozhodnutím a postupem někdo problém? Díky Vojtěch Dostál (talk) 19:51, 31 August 2021 (UTC) P.S: Akorát jsem si uvědomil, že by ještě bylo potřeba opravit reference, které používají P6656 (P6656). Akorát na ty teď nejsem schopen sepsat dotaz.Vojtěch Dostál (talk) 19:57, 31 August 2021 (UTC)

V dokumentační šabloně v diskusi máš počty použití vlastnosti i s odkazy na dotaz, ne? ;-) --Mormegil (talk) 04:53, 1 September 2021 (UTC)
Aha, hm, 12 000 použití [blinkající smajlík]. Vojtěch Dostál (talk) 04:56, 1 September 2021 (UTC)
Jenže všechny až na těchto 48 použití jsou jen IIANM „reference“ toho samotného identifikátoru, např. Q94938987#P6656 (fakt netuším, komu to proč přijde jako dobrý nápad, tvářit se, že „identifikátorem osoby XY v databázi DD je KKK“ lze doložit… identifikátorem KKK v databázi DD“), které jdou smazat prostě s mazáním toho identifikátoru samotného, netřeba je vůbec nijak víc řešit. --Mormegil (talk) 15:15, 1 September 2021 (UTC)
No, to já občas dělám (např. pokud v položce byl odkaz na Národní autority a podle něj jsem doplnil ID Bibliografie - které má ve své databázi Národní autority uvedené, tak toto ID "pochází" z Bibliografie). Každopádně jsem navrhl vlastnost ke smazání na Wikidata:Properties_for_deletion#identifikátor_Bibliografie_dějin_Českých_zemí_(P6656) Vojtěch Dostál (talk) 12:27, 10 September 2021 (UTC)

Kandidát na seznam z wikidat – Pojménováno po Masarykovi

cs:Diskuse:Tomáš_Garrigue_Masaryk#Objekty po něm pojmenované--TFerenczy (talk) 11:05, 1 September 2021 (UTC)

Workshop "Import databáze do Wikidat"

  Notified participants of WikiProject Czech Republic --Vojtěch Dostál (talk) 14:33, 28 September 2021 (UTC)

Hezký svátek všem, rád bych vás pozval na svůj workshop "Import databáze do Wikidat". Je určen pro wikidatisty, kteří už rozumí základům práce ve Wikidatech a od ručního editování jednotlivých položek se chtějí posunout ke zpracovávání celých databází, bez nutnosti učit se programovat. Naučíte se se scrapovat weby, transformovat data v tabulkách v OpenRefine, párovat wikidata položky na základě podobnosti jmen a na základě geografické blízkosti, a importovat data do Wikidat. Jsou pro vás připraveny nejméně 4 databáze, které si zpracujete a práce tedy bude mít hmatatelný výsledek.

Workshop bude pravděpodobně celodenní a proběhne na podzim v Praze, ve víkendový den či v pátek. Pokud máte zájem se zúčastnit, můžete vyplnit své časové preference ve formuláři Doodle: https://doodle.com/poll/kx228r254idc2x8y

A to ideálně do konce týdne :-). Později bude možné se přihlásit, ale už ke konkrétnímu termínu. K práci budete potřebovat vlastní laptop, sice byste si mohli půjčit spolkový, ale moc to nedává smysl, protože cílem bude si nainstalovat a nakonfigurovat nějaké programy a pak je ideálně dále používat ve své práci na Wikidatech.

s pozdravem --Vojtěch Dostál (talk) 14:33, 28 September 2021 (UTC)

Díky moc za velký zájem o workshop - přihlásilo se vás více, než jsem čekal. Workshop se tedy uskuteční 27. 11. cca od 9:30 v kanceláři Wikimedia Czech Republic (Q15735556); snad to epidemiologická situace umožní.
Prosím ty, kterým se tento termín hodí a plánují se zúčastnit, aby mi vyplnili krátký formulář (3 otázky): https://docs.google.com/forms/d/e/1FAIpQLSdthf4-Lgf9dWXVA8VTI5vKEFam_Jx9nGGWFRmhBcA9ByUIBw/viewform Vojtěch Dostál (talk) 16:01, 1 October 2021 (UTC)

SCK

Zdravím. Databáze SCK jako např. https://aleph.nkp.cz/F/?func=direct&doc_number=000001899&local_base=SCK asi nemá na WIkidatech žádnou položku, že? --Jan Kameníček (talk) 16:34, 8 November 2021 (UTC)

@Jan.Kamenicek Asi máš na mysli vlastnost - nemá. Problém je v tom, že ty záznamy nemají žádný unikátní identifikátor kromě toho systémového čísla. Ale to je pokud vím nestabilní... Nevěděla by o tom náhodou víc @Linda.jansova? Vojtěch Dostál (talk) 19:53, 8 November 2021 (UTC)
@Jan.Kamenicek a @Vojtěch Dostál No já bych to tak černě neviděla; ostatně i v poli 001 (při zobrazení záznamu ve formátu MARC) je (na výše uvedeném příkladě) možné najít identifikátor "sck01899", což je odvozenina z toho systémového čísla. Dramatické přesuny dat mezi záznamy v této databázi spíše neočekávám ;-). Na další detaily se můžu poptat u kolegů, kteří bázi vytvářejí... Linda.jansova (talk) 20:19, 8 November 2021 (UTC)

Gregoriánský kalendář u letopočtů před 1582

Při procházení položek jsem narazil na to, že data (uváděná např. u time of earliest written record (P1249)) před rokem 1582 mají nastavenou hodnotu na „gregoriánský“ kalendář, což je minimálně z faktického hlediska anachronismus. Napadá mě k tomu: 1) je to chyba, nebo záměr? 2) je nutné to u hodnot s přesností na rok řešit? – resp. kdyby se to neuvádělo, tak je to asi jedno, ale takhle uvedené u všech dat to minimálně mě bije do očí 3) pokud (1) a (2) = PRAVDA, jde to hromadně opravit? — Draceane talkcontrib. 13:11, 12 November 2021 (UTC)

Tak na Wikidatech se každopádně používá proleptický gregoriánský kalendář (a proleptický juliánský), takže v tomto smyslu čistě technicky není samo o sobě chybou mluvit o datu např. „1234 gregoriánského kalendáře“. Samozřejmě je otázkou, jaké datum má být fakticky reprezentováno, což, jak píšete, nemá u dat s přesností na rok v zásadě ani moc smysl diskutovat. Samozřejmě to je takové „ošklivé“… Měl jsem dojem, že se podobná problematicky zapsaná data někdy nějak označovala nějakým příznakem (i možná s ohledem na nějaké chyby v implementaci Wikidat) k případné strojové opravě, ale teď zrovna ho nemůžu najít… --Mormegil (talk) 15:02, 12 November 2021 (UTC)
nějakým příznakem – Asi máš na mysli statement with Gregorian date earlier than 1584 (Q26961029). --Matěj Suchánek (talk) 11:07, 14 November 2021 (UTC)
@Draceane: Kdysi jsem na to dojel, když jsem importoval data z Czech National Authority Database (Q13550863). Ten neuvádí, zda uváděnými daty před r. 1582 myslí data v Gregoriánském či Juliánském kalendáři. Nyní radši tato data před r. 1582 ze zmíněné databáze pokud možno vůbec neimportuji, abych se vyhnul rozhodování, jaký kalendář jim mám nastavit. Vojtěch Dostál (talk) 18:46, 17 November 2021 (UTC)

Dvojí obuv

Poradil by mi prosím někdo, jaký je rozdíl mezi položkami footwear (Q161928) a shoe (Q22676)? Oboje jsou v češtině pojmenovány obuv, první je zjevně obecnější: teď jde asi o to, jak se k tomu postavit v češtině a ideálně obojí unikátně pojmenovat. — Draceane talkcontrib. 15:11, 10 December 2021 (UTC)

@Draceane To první zahrnuje i ponožky. Obávám se, že pro to nemáme v češtině dobré souhrnné označení a "obuv" je velmi zavádějící :). Vojtěch Dostál (talk) 13:16, 11 December 2021 (UTC)
Jeden ze slovníků to překládá jako „vše, co se nosí na nohou“. Jinak slovník na seznam.cz to překládá jako „obuv a ponožky“, což by mohlo být použitelné? Snad. --Silesianus (talk) 15:00, 11 December 2021 (UTC)
Buď tak, nebo úplně odstranit český label a hlavně doplnit dostatečně výstižný popisek. Vojtěch Dostál (talk) 15:36, 11 December 2021 (UTC)
Protiklad je bosky, dal jsem tomu název Obutí a změnil popis. Ale teď by to chtělo projít sitelinky (cs+sk) včetně kategorií... JAn Dudík (talk) 09:22, 13 December 2021 (UTC)
Díky za řešení, zapíšu si to do poznámek položek, kde máme pravděpodobně pomíchané interwiki. — Draceane talkcontrib. 10:26, 17 December 2021 (UTC)

Import z NKČR AUT

Ahoj, vím, že jsi @Vojtěch Dostál: dělal importy osob z databáze autorit NKČR. Nicméně se mi poměrně často stává, že ačkoliv osoba v AUT existuje, na WD ji nemáme (v poslední době jsem zakládal např. Radim Cigánek (Q109889967), Jan Kvirenc (Q110071958), Zbyněk Drahoňovský (Q110044627), Tomáš Řehák (Q108117514), Klaret Antonín Dabrowski (Q106213752), Lukáš Vráblík (Q106086846)). Podle jakého klíče se vybíraly osoby, co se na WD importovaly? Vyplňovat osoby manuálně je celkem otrava, tak bych se chtěl zeptat, jestli by nemohlo proběhnout další kolo importu. (A omlouvám se, pokud v tom je nějaký promyšlený systém, jak to funguje.) — Draceane talkcontrib. 10:36, 17 December 2021 (UTC) PS. Uvažoval jsem, jestli ti to psát přímo, ale zvážil jsem, že to je možná trochu obecnější téma, tak jsem napsal sem.

Ahoj @Draceane, vybíraly se osoby, které měly v Autoritách uvedeno přesné datum narození (na den), aby byly dostatečně identifikovatelné. Bylo jich tenkrát 75000 - viz poslední sekci tohoto blogového příspěvku. Pak se ještě letos dělal drobný import takových osob, které jsme schopni spárovat s vědeckými identifikátory. Další kolo importu by určitě proběhnout mohlo, například se nabízí všechny osoby, které mají uvedeno aspoň nějaké datum narození či datum úmrtí (s přesností aspoň na rok). Budou jich myslím stále desetitisíce. Potřeboval bych k tomu aktuální data v naší wikibase, z níž údaje beru. Můžeme poprosit Frettieho, jestli by na to nekouknul a neaktualizoval stávající záznamy + doimportoval ty nové :) Co, Jirko, zhostil by ses toho? :) Vojtěch Dostál (talk) 10:46, 17 December 2021 (UTC)
Tak doimportovat to do naší Wikibase nebo i do Wd to asi můžeme. Ale bude to nejspíš slušný peklíčko. Ale můžeme si aspoň vydefinovat koho tam vytáhneme a pak si předpřipravit data. A nějak to propárovat, což v tomhle množství je značně netriviální záležitost. --Frettie (talk) 15:56, 18 December 2021 (UTC)

Petr Zlamal - spojení položek

Prosím o laskavé spojení položek Q95228060 a Q110232485 (Petr Zlamal). Děkuji. --Gampe (talk) 06:13, 22 December 2021 (UTC)

@Gampe Sloučeno, děkuji za nahlášení :) Vojtěch Dostál (talk) 08:40, 22 December 2021 (UTC)