About this board

Logo of Wikidata

Welcome to Wikidata, Vojtěch Dostál!

Wikidata is a free knowledge base that you can edit! It can be read and edited by humans and machines alike and you can go to any item page now and add to this ever-growing database!

Need some help getting started? Here are some pages you can familiarize yourself with:

  • Introduction – An introduction to the project.
  • Wikidata tours – Interactive tutorials to show you how Wikidata works.
  • Community portal – The portal for community members.
  • User options – including the 'Babel' extension, to set your language preferences.
  • Contents – The main help page for editing and using the site.
  • Project chat – Discussions about the project.
  • Tools – A collection of user-developed tools to allow for easier completion of some tasks.

Please remember to sign your messages on talk pages by typing four tildes (~~~~); this will automatically insert your username and the date.

If you have any questions, don't hesitate to ask on Project chat. If you want to try out editing, you can use the sandbox to try. Once again, welcome, and I hope you quickly feel comfortable here, and become an active editor for Wikidata.

Best regards! --Tobias1984 (talk) 22:23, 13 May 2014 (UTC)

Previous discussion was archived at User talk:Vojtěch Dostál/Archive 1 on 2022-06-21.

ŠJů (talkcontribs)

Ahoj, bylo by možné ke všem fotkám z Drobných památek v Commons nějakou formou dodatečně naimportovat data? Většina položek byla v Drobných památkách založena jednorázově a pro celou památku je uveden text např. "přidáno: 7. listopadu 2022". Není to sice přímo datum pořízení fotografií, ale je to aspoň nějaké vodítko - lepší než když to máme úplně bez jakéhokoliv data. A předpokládal bych, že ve většině případů to bude datum nedlouho po pořízení fotek, tj. že přispěvatelé Drobných památek nemívají ve zvyku zakládat záznamy a nahrávat fotky např. s několikaletým zpožděním. Pokud jsou k některé památce přidávány fotky dodatečně, pak u těch přidaných datum bývá.

JAn Dudík (talkcontribs)

@ŠJů: Na Drobných památkách člověk založí památku a tu potom admin schválí a publikuje. U památky se poté zobrazuje (přihlášeným) jméno přidávajícího a (všem) datum založení. Jenže pak je zde velká skupina DP založených 31. října 2021 a ještě asi o pár dní později - to byl import z Wikidat a uživatelé si mohli tyto památky (importované z účtu zwiki) přiřadit pod sebe. To by se dalo ošetřit pomocí ID, které bude v určitém rozsahu. A pak tam jsou i tací uživatelé jako já, kdy postupně procházím archiv a importuji dříve pořízené památky - a ještě mi chybí období cca 2014-2018, starší i novější jsem již během posledního roku nahrál. Takže u mnou založených klidně najdeš památku s fotkou z roku 2006 (někdy opatřuji poznámkou o roku, ale většinou jen u těch, které mají na fotce špatný stav nebo si nejsem jistý, zda dosud existují) - a neví, nakolik podobné věci dělají i jiní uživatelé. A pak je otázka, jak to zjistit - asi jedině scrapingem ze stránky památky, v exportované databázi tento údaj (ani o vkladateli) není.

Vojtěch Dostál (talkcontribs)
Strom auf der Gurke (talkcontribs)
Vojtěch Dostál (talkcontribs)

Hello, Q115156398 is an interior of a building that is used for living.

Thanks for working on these!

Coward at heart (talkcontribs)

Hello Vojtěch,

I'm giving my best to understand the Czech words, because the English translations are sometimes very sloppy. simplified reading (Q115154811) simplified reading for example is meaningless in English. Does it mean a form of plain language (Q1814648)?

PS: Are the subject headings from NKC the only ones which got imported completely into Wikidata? I don't know much about this, but RAMEAU (Q13421502) and Library of Congress Subject Headings (Q1823134) seem not be here yet.

Best wishes!

Vojtěch Dostál (talkcontribs)

What can I say? It is true. Still, I think that including the English labels is better than skipping them altogether. I am fixing the most obvious mistakes manually. In the case of Q115154811, I think it actually means "adaptation of foreign-language books for non-native speakers" so it might not have anything to do directly with reading per se.

Some medical headings (MeSH) got imported recently too. I am not sure about LoC headings. I have been importing the Czech headings because they are used to connect people to their fields of work. But now the work's largely over (all headings used >20 times are now in Wikidata) and I'll proceed to the import : Wikidata:Requests for permissions/Bot/VojtěchDostálBot 1

Coward at heart (talkcontribs)

I didn't mean to tease the Czechs ;). The English of the Finnish people from YSO is sometimes even sloppier!

Maybe you've just done the import for library needs, but it has also brought many translations for concepts the Czech Wikipedia hasn't reached yet.

Chybné přiřazení kategorie Commons

2
ŠJů (talkcontribs)

Ahoj. Toto přiřazení kategorie Commons:Category:Cemetery gates in Břeclav District položce konkrétního hřbitova je zjevná chyba, ale z popisu editace se mi nepodařilo dovodit, z čeho k ní tvůj bot dospěl. Jako že by jen tak sám od sebe přišel na to, že zrovna čtvrtá z pěti kategorií, do kterých je vložen titulní obrázek položky, je kategorií pro téma dané položky? To nedává smysl.

Vojtěch Dostál (talkcontribs)

Ručně jsem tyhle kategorie vyhazoval, ale jedna dvě mi mohly uniknout. Omlouvám se, pokud jsem někde neudělal hrubou chybu, tak by to měla být výjimka.

Reply to "Chybné přiřazení kategorie Commons"
Summary by Vojtěch Dostál

ok

אפיפיור טמא (talkcontribs)

Ahoj, please stop the import for a while. There are many duplicate concepts which need to be merged and I don't want to loose track.

Vojtěch Dostál (talkcontribs)

Hello, the import was just one batch and I curated all of them manually. So now, you have time :). But, are you sure many of them are duplicates? For example, I am not sure that "theory of science" and "philosophy of science" are proper duplicates.

Strom auf der Gurke (talkcontribs)
JAn Dudík (talkcontribs)

Ahoj, mohl bys, prosím, naimportovat letošní várku drobných památek? + případně předem ztotožnit potenciální duplicity podle souřadnic? Po aktualizaci openrefine a Javy mi nejde nahrávat a zatím jsem se nedokopal k přeinstalaci.

Vojtěch Dostál (talkcontribs)

Ahoj, no zkusím to, ale ono je to hrozně práce. Ideální by bylo udělat nějakou šablonu, která by se vždy spustila na aktuální data, že? Sice tam stejně zůstane nutnost ztotožnit ty duplicity, ale alespoň to otravné úvodní formátování by se usnadnilo.

JAn Dudík (talkcontribs)

Pro začátek by asi stačilo spárovat, případně, pokud bys uměl, označit smazané. Bohužel je zřejmě Openrefine dělané na jednorázové importy, ne na opakované, chybí, že by si člověk předem připravil dvě databáze a tabulku, a v budoucnu by se pouze nahradily aktuální databáze a pustilo znovu.

Reply to "Drobné památky"

Doplňování informací o českých knihovnách

6
Steam Flow (talkcontribs)

Zdravím,

všiml jsem si, že doplňujete informace k záznamům českých knihoven. Knihovny.cz mají API, která poskytuje informace z ADR báze, kterou má NKP a Aleph. Lépe se s tím pracuje a má to lépe strojově čitelný formát.

Rádi se připojíme. Myslíme, že by bylo zajímavé přidat i otevírací dny, hodiny ... protože to v ADR dostupné není. Případně i další informace jako profily na sociálních sítích atp.

Vojtěch Dostál (talkcontribs)

Hezký den, to zní jako dobrý nápad. Otevírací dny a hodiny by bylo super přidat, profily na soc. sítích taktéž. Jaký API call bude nejlepší, abych tato data získal? Poradíte?

Steam Flow (talkcontribs)

Informace o otevírací době i sítím jdou nad rámec ADR. API by Vám mělo poct, pokud budete chtít aktualizovat informace přímo do Wikidata. Pak je to volání https://www.knihovny.cz/swagger-ui/?url=%2Fapi%3Fopenapi#/Search/get_libraries_search

Třeba podle sigla. S tím plněním otevíracích dob můžeme pomoct. Ale potřeboval bychom asi nějakého bota, který se o to postará. Můžeme se třeba někdy sejít on-line a probrat to? Mohu vytvořit jeden vzorový záznam a nad ním to pak promyslet a projít?

Steam Flow (talkcontribs)

Omlouvám se, otevírací hodiny lze získat i přes to API. Jen je možné, že nebude všude vyplněno.

Na příkladu volání to snad bude jasnější.

Steam Flow (talkcontribs)

Tento příklad by měl vracet všechny otevírací doby všech knihoven, dolpněno o její název a siglu.

Vojtěch Dostál (talkcontribs)

Děkuji, až budu mít chvíli, kouknu na to.

Můžeme si klidně i zavolat - pokud jste ochoten mi to poslat v nějakém tabulkovém formátu či JSON, bude pro mě jednodušší data do Wikidat vložit (o bota se postarám už já). Napište v tom případě prosím přes Special:EmailUser/Vojtěch_Dostál a domluvíme se. Díky moc.

Summary by Epìdosis

All the cases reported have been solved

Epìdosis (talkcontribs)

Hi! In August I managed to empty Property talk:P214/Duplicates/humans, which contained - in successive updates - a total of about 2.5 k couples of items having the same value of VIAF ID (P214) (sometimes duplicates, sometimes items having a wrong VIAF and being bad conflations, sometimes items having a conflated VIAF) ... it was a long, and very interesting, day-by-day job (I left some notes in Wikidata:WikiProject Duplicates/VIAF members).

Now @Bargioni: is adding to all humans (about 30k) which had NKC but not VIAF the corresponding VIAF ID (P214) ... and the number of humans having the same VIAF ID (P214) reached a new peak. I remember that you and @Frettie: already merged some thousands of duplicates using prudent but efficient criteria like "same VIAF + same name + same dates" and similar ones (I don't remember exactly, if you wrote them down somewhere I would enjoy seeing that page also for future reference); could you please have a new run of these merges, in order to decrease the number of duplicates in the VIAF list? Of course leave out potentially unsure cases, I will be glad to slowly revise them by hand (in the last weeks I have already deprecated hundreds VIAFs as conflated, in fact, so prudence is always needed). I suggest to start when Bargioni's batches will be over (less than 24 hours from now, I guess). Thanks in advance!

Vojtěch Dostál (talkcontribs)

Hi @Epìdosis, I can give it a try, although I have already applied the mentioned "same VIAF + same name + same dates" criterion to my latest batch. Even if they did not have VIAF, I downloaded it from viaf.org to OpenRefine and compared it to other items. But I will think about it in the coming days. I am just now moving to your country for three months (Naples, though) so it might not be right now because I need to settle a bit :).

Vojtěch Dostál (talkcontribs)

+ thank you for the work you have been doing on VIAF duplicates, of course.

Epìdosis (talkcontribs)

A little update: the batches adding VIAF are finished, the number of probable duplicates is around 4k couples of items as of now (https://w.wiki/5iQx); I have already manually merged some hundreds of couples, including some tens of couples in which one of the two items didn't have a Latin-script label. Of course, in some cases (less than 10%, I think) the couple is not of duplicates, because one of the two items has a wrong VIAF cluster, or the cluster is conflated.

Now I will check one by one the about 400 couples of probable duplicates having different date of birth (P569) (https://w.wiki/5iQy), which surely cannot be merged through automated criteria; I will do the same also for date of death (P570). I will keep you informed :)

Vojtěch Dostál (talkcontribs)

Thank you @Epìdosis. I will try to distribute the first query to the Czech community so that we can help with that a little :).

Epìdosis (talkcontribs)

I think I have finally emptied the about 400 couples of probable duplicates having different date of birth (https://w.wiki/5iQy) - it was difficult, many cases were bad conflations I had to districate, as I previewed (anyway, the NKC import was very useful to spot them!); the number of probable duplicates (https://w.wiki/5iQx) is now around 3.5k. Could you maybe retry your OpenRefine match in order to see if we can lower it through semiautomatic merges (maybe in cases like this or this), of course with reasonable precision (otherwise better to do everything manually)? Thanks as always!

Vojtěch Dostál (talkcontribs)
Epìdosis (talkcontribs)

Great job! The number of probable duplicates (https://w.wiki/5iQx) is now around 1.3k, I hope I can fix all of them before mid November.

Vojtěch Dostál (talkcontribs)

Thank you. This is a very important job you are doing.

Epìdosis (talkcontribs)

Property talk:P214/Duplicates/humans finally emptied, after nearly two months of interesting work; mostly merges, but also some tough conflations that needed solving. Thanks very much again for your help!

Sčítání a počet obyvatel

7
Summary by Vojtěch Dostál

hotovo

Jklamo (talkcontribs)

Díky za ten importu počtu obyvatel ze sčítání 2021 pro části obcí! Předpokládám, že ranky pak nějak upravíš přes bota.

Akorát koukám, že u point in time (P585) uvádíš 2021, zatímco u importu do obcí se uvádělo přímo 26. března 2021. Bylo by dobré, aby to bylo jednotné, aby se to dalo lépe využít. Konkrétně třeba v šabloně Šablona:Tabulka počtu obyvatel na cswiki, která se používá na obce i části obcí pak nevím, jak bych tam pak rok 2021 doplnil (aby se korektně tahal z obcí, kde jsou i nesčítací údaje, tak i z částí obcí). Pokud to bude jednotné, nebude to problém.

Vojtěch Dostál (talkcontribs)

Ahoj, fajn, není problém vymezení změnit! Hned jak doběhne import. Díky za zpětnou vazbu. S ranky počítám.

Jklamo (talkcontribs)

Fajn, díky!

Vojtěch Dostál (talkcontribs)

Trochu se to protáhne, chtěl bych ty ranky a ta data udělat v jedné editaci a ne ve třech a zjišťuji, jak na to.

Vojtěch Dostál (talkcontribs)

Za chvíli to doběhne, mělo by to tím být vyřízené.

Jklamo (talkcontribs)

Díky moc!

Koukal jsem i po počtech domů pro části obcí, ale nikde to v těch otevřených datech nevidím. Asi to ještě není zveřejněné.

Vojtěch Dostál (talkcontribs)

Taky myslím. Zatím se bez toho bude muset cswiki obejít, ale pak to určitě doimportujeme.

Dick Bos (talkcontribs)

Dear Friend,

a couple of month ago you have been changing al the names of cultivars on wikidata, for instance Geranium maculatum 'Elizabeth Ann' into Geranium maculatum ʽElizabeth Ann’ (Q110767126). Is there a reason why you have done that? I would be happy to hear. Greetings, --~~~~

Vojtěch Dostál (talkcontribs)