Wikidata:Bar/Archive/2022/10

This page is an archive. Please do not modify it. Use the current page, even to continue an old discussion.


Problema con l'import delle scuole italiane su Wikidata

  Notified participants of WikiProject Italy

Come ho già scritto nel canale Telegram di Wikidata in italiano, temo che l'import fatto sulle scuole italiane sia completamente da buttare e rifare da capo.

Tempo fa, @Giaccai: mi aveva fatto notare che se cerchi "Casa circondariale" su Wikidata appaiono un sacco di scuole di ogni ordine e grado. Oggi ho finalmente indagato questa cosa e ho scoperto che praticamente sono stati rimossi dal DB scuola tutti i riferimenti a distaccamenti presso case circondariali. Ma non solo: anche altre scuole "legittime" (tipo medie, superiori, ecc.) sono scomparse dal database.

In altri termini, credo che toccherà presto fare un controllo sui 65k elementi con proprietà Italian School ID (P5114) e capire quanti di questi andranno cancellati per direttissima e quanti dovremo recuperarne di nuovi. Ho già scritto anche nel canale Telegram di WMIT, visto che l'import fu curato dall'associazione (che io ricordi) e che qua mi sa che toccherà coordinare gli sforzi con loro. Sannita - not just another it.wiki sysop 12:44, 14 October 2022 (UTC)

Discussione fra Sannita e Alexmar
Si sa da anni, fu uno dei primi temi discussi in questo progetto. In Toscana le ripuliamo e se non dovessimo stare dietro a altre cose ce ne occuperemmo anche di più. Non sarà né il primo, ne l'ultimo import gestito da un capitolo "traballante", ci siamo "abituati". Ne siamo coscienti ed è nella media di ogni "emergenza". Insomma per noi volontari è de facto amministrazione abbastanza ordinaria.
Davvero nella nostra regione avremmo già provveduto a pulirlo in modo sistematico... causa altre situazioni da risolvere il ritmo è più basso. In genere quando noi curiamo per esempio WLM per un comune da un paio d'anni ne approfittiamo per curare sistematicamente un po' di tutto, e quindi sanificare anche questi elementi. La maggior parte delle vecchie scuole elementari sono dei tempi della Legge Casati e a volte di proprietà comunale, contengono memoriali... quindi è inevitabile, se non ci si limita a buttare un codice il lavoro (ripulitura delle label, miglioramento geocoordinate con User:DnaX e collegamenti agli item poli didattici, collegamento a persona intitolata) viene svolto da me, Susanna, Manuela, meno Camillo che si dedica a altri temi adesso.
Purtroppo se devi passare giorni a spiegare al comune che la liberatoria è piena di imprecisioni sulla proprietà, o settimane a categorizzare panoramiche di frazioni finite nella categoria generale del comune in Commons, o che altro, inevitabilmente per questo c'è meno tempo. Però per noi qua è un'emergenza che sappiamo sarà assorbita, e del resto non auspico particolarmente un'opera se centralizzata" per "risolverla" perché poi finisce come con WLM che ogni anno c'è la grande opera e iniziativa e l'anno dopo l'altra grande opera eccetera eccetera eccetera... ogni anno sembra tutto a posto, e poi restano i cocci. per dire il mio tempo quest'anno andrà dietro a controllare a uno auno l'import dei castelli chiedi a DnaX il tempo passato due ore su ogni rocca a fare ordine e decidere cosa unire e cosa no. Niente di ingestibile e si fa di necessità virtù, ma lì comunque si finisce.
Rocche, scuole, archivi importati da WMSE... c'è sempre qualcosa da rifare a mano per cui una in più o meno, andando comune per comune i costi si ammortizzano.
Quindi spero nessuno tiri fuori soluzioni centralizzate perché si finirebbe con altri inciampi, solitamente. Prima vengono i problemi che si rinnovano ogni anno, poi quelli che sono stati fatti una tantum e restano sul groppone e poi quelli una tantum che si "assorbono" da soli. Questo in pratica rientra nella terza categoria perché abbiamo fatto di necessità virtù e così si organizza il lavoro. Rifatto da capo finirebbe nella prima, e a seconda di come eseguito magari finerebbe scancellato parte del lavoro già fatto per sistemarlo. Perché se uno li cancella adesso troppi di botto è lavoro buono, manuale che viene perso. Almeno salverei quelli che hanno coordinate, perché quelle dovrebbe esserci state messe se passiamo noi. meglio ancora a occhio anche quelli senza coordinate ma sopra 10-12 statement c'è lavoro manuale e non ha senso toccare molto.
Se poi serve che si butti giù un tutorial per volontari su come ripulirle, si fa anche quello.--Alexmar983 (talk) 13:34, 14 October 2022 (UTC)
In alternativa, cancellare solo quelli con tipo stringa " (Italy) [school id: ]" nella descrizione inglese o simile in italiano, se ci siamo passati sono meglio adesso, ma in generale non toccherei con quello ID P5114 e oltre almeno 10 statement, in particolare la P18--Alexmar983 (talk) 13:40, 14 October 2022 (UTC)
Ok, tutto molto bello, ma riesci a mettere giù una lista puntata con le tue proposte? Perché andarmele a cercare nel tuo (come al solito prolisso) intervento proprio non mi va e io sto cercando di capire come vogliamo procedere. Sannita - not just another it.wiki sysop 13:50, 14 October 2022 (UTC)
Più nello specifico: vorrei capire se qua dobbiamo andare elemento per elemento a vedere se il codice è ancora attivo oppure se esiste un metodo per automatizzare almeno questo pezzo e tirare fuori una query degli elementi da cancellare perché il codice riporta 0 risultati. Sannita - not just another it.wiki sysop 14:00, 14 October 2022 (UTC)
(conf.)il concetto chiave è che gli import non sono in teoria da impostare in base ai progetti dei capitoli, ma nei fatti con gli import fatti male o maluccio e iniziative massive noi volontari ci conviviamo da anni. Quando tu autorizzavi chiese e beni provinciali nelle liste di WLM p.e. ero io che dovevo telefonare al comune a rifare da capo, stesso principio qui. Come con WLM un anno c'era il sistema automatico, l'import dal database o si pagavano soldi per il supporto legale, ma alla fine in prima fila c'è un volontario che sistema(va). Ci sarà anche p.e. ora per l'import dei beni culturali della Lombardia, immagino... anche rifancedolo l'import delle scuole, ci sarà anche qui. Solo che qui c'è già stato in molti elementi in anni.
Si può rifare e dire che sarà perfetto a quel punto ma tanto non lo sarà. In compenso c'è chi il lavoro lo sta facendo da anni. Quindi se procedi eslcudi la Toscana perché abbiamo il nostro piano di lavoro, impostato anni fa quando a WMI non interessava risolvere il problema, e se cancelli butti lavoro già svolto, accuratamente. Possiamo completarlo prima che qualcuno proceda a cancellarli se serve, e chiuderla.
Se vuoi procedere a livello nazionale, ti consiglio di non toccare elementi con P5114 e più di 10 statement in generale, o con un altro ID, e forse anche con P18. C'è già passato qualcuno del territorio e c'èha già lavorato. In qualsiasi regione. Suppongo che a Como e dintorni, o in zone di Emilia, Piemonte, Marche e Abruzzo qualcuno ci avrà già lavorato.--Alexmar983 (talk) 14:04, 14 October 2022 (UTC)
Togli pure tutti gli ID, nessuno ha mai usato quel codice per fontare mi sa... basta che se l'elemento ha P18, collegamenti a commons, più di 10-12 statement lo lasci perché è un ottimo elemento. Poi se ci vuoi rifare un import sopra avrà sicuramente dei problemi, non si sa quanti, ma ci siamo abituati. Basta che non si tolgano elementi già impostati e revisionati, altrimenti sarebbe una beffa ripartire da capo.--Alexmar983 (talk) 14:07, 14 October 2022 (UTC)
@Alexmar983 ok, grazie per avermi ricordato che le cose fatte bene le sai fare solo tu e solamente tu, mentre tutti gli altri sono degli emeriti imbecilli, a partire dal sottoscritto. Molto costruttivo da parte tua, come al solito. Sannita - not just another it.wiki sysop 14:08, 14 October 2022 (UTC)
Ti ho ricordato la realtà che viviamo. Quella è. Ci tocca. Se sopravviviamo noi, puoi sopravvivere tu senza tirtarla all'estremo livello come escamotage retorico. C'est la vie. So che l'import avrà dei problemi, visto che ci dovrò perdere il mio tempo, almeno a questo giro gradirei evitarlo. Per farlo è sufficiente non fare nulla in qusto caso, ma in altri casi si è insistito a fare qualcosa. Ti pregherei nei limite del possibile di non fare nulla in Toscana, ce ne occupiamo noi.--Alexmar983 (talk) 14:14, 14 October 2022 (UTC)

Recupero la domanda che ho cassettato: vorrei capire se qua dobbiamo andare elemento per elemento a vedere se il codice è ancora attivo oppure se esiste un metodo per automatizzare almeno questo pezzo e tirare fuori una query degli elementi da cancellare perché il codice riporta 0 risultati. Sannita - not just another it.wiki sysop 14:18, 14 October 2022 (UTC)

Ciao, visto che era una cosa che mi rodeva da tempo (cercare grazia deledda e ti escono 35 scuole è una cosa insensata) a settembre ho scaricato il db e ho provato a pulire gli istituti comprensivi e poi ho cominciato a pulire le scuole primarie aggiungendo/provando ad uniformare le etichette ita/eng. Con gli istituti comprensivi mi è andata abbastanza bene, ho pulito (con risultati misti) le etichette di 4269 IC (che prima erano nel migliore dei casi "Ist. Comp"/"IC"/"I C"/"Istituto Com." etc e ora cominciano tutte con "Istituto Comprensivo" -> query) ma affrontando le scuole primarie i risultati sono meno convincenti, ho lavorato principalmente con le scuole intitolate a personaggi ma la quantità di abbreviazioni schizofreniche degli istituti, denominazioni scuola che ereditano la denominazione dall'istituto comprensivo di riferimento, spazi a caso... insomma si esce pazzi, ne ho pulite 1700 e mi son fermato. il fatto di buttare e rifare daccapo non credo aiuterebbe perchè è proprio il db di partenza che è sporco ad un livello atomico. divudì 18:08, 14 October 2022 (UTC)
Io sarei molto interessato all'argomento. Se qualcuno potesse riassumermi le problematiche principali, potrei capire come aiutare. Grazie! --Horcrux (talk) 08:29, 17 October 2022 (UTC)
Grazie a @Francians:, ho una lista di item che possono essere cancellati. L'ho messa in una mia sandbox, ma potete prenderne un pezzo tutti e iniziare a controllare, poi passo io a cancellare ciò che va cancellato. Sannita - not just another it.wiki sysop 12:28, 18 October 2022 (UTC)
Come regola generale, scuole che hanno coordinate o immagini non vanno cancellate. Fosse per me cancellerei tutte le scuole dell'infanzia che spesso hanno lo stesso nome della frazione creando confusione su WD oltre ad essere poco rilevanti. Andrebbero anche rinominati tutti gli item aggiungendo "Scuola primaria "Tizio Caio"" per esempio.--DnaX (talk) 21:36, 27 October 2022 (UTC)

Piccolo script utile (per me)

Mi serviva un gadget banalissimo, che, aperta la pagina di un elemento, facesse comparire un bottone per copiare l'id dell'elemento nella clipboard, e l'ho fatto: User:alex brollo/common.js. Il vantaggio è modesto: evita un seleziona-copia, niente di tale, ma.... ho scoperto l'acqua calda? Alex (talk) 14:49, 16 October 2022 (UTC)

Data di creazione incerta

Ciao a tutti! Come faccio, qui, a inserire la data di creazione sapendo che non ho una data precisa, ma un range che va dal 1704 al 1728? Syrio posso aiutare? 11:48, 24 October 2022 (UTC)

@Syrio: Che io sappia, questo è il modo più preciso. Per altri tipi di incertezza (es. "prima metà del secolo", "seconda metà dell'anno", ecc.) esiste anche il qualificatore refine date (P4241). --Horcrux (talk) 11:58, 24 October 2022 (UTC)
Grazie! Avevo provato a mettere "XVIII secolo" ma non me lo prendeva! --Syrio posso aiutare? 12:00, 24 October 2022 (UTC)
@Syrio: Sì, i secoli sono un po' ostici da inserire a mano per via del carattere speciale º. Io di solito scrivo un'approssimazione dell'anno medio (in questo caso ho scritto "1715"), poi clicco su "precisione: anno" e infine seleziono "secolo". --Horcrux (talk) 12:08, 24 October 2022 (UTC)
Ok, grazie mille! --Syrio posso aiutare? 12:13, 24 October 2022 (UTC)