About this board

Logo of Wikidata

Welcome to Wikidata, Bouzinac!

Wikidata is a free knowledge base that you can edit! It can be read and edited by humans and machines alike and you can go to any item page now and add to this ever-growing database!

Need some help getting started? Here are some pages you can familiarize yourself with:

  • Introduction – An introduction to the project.
  • Wikidata tours – Interactive tutorials to show you how Wikidata works.
  • Community portal – The portal for community members.
  • User options – including the 'Babel' extension, to set your language preferences.
  • Contents – The main help page for editing and using the site.
  • Project chat – Discussions about the project.
  • Tools – A collection of user-developed tools to allow for easier completion of some tasks.

Please remember to sign your messages on talk pages by typing four tildes (~~~~); this will automatically insert your username and the date.

If you have any questions, please ask me on my talk page. If you want to try out editing, you can use the sandbox to try. Once again, welcome, and I hope you quickly feel comfortable here, and become an active editor for Wikidata.

Best regards! Liuxinyu970226 (talk) 09:26, 28 March 2016 (UTC)

Previous discussion was archived at User talk:Bouzinac/Archive 1 on 2018-08-08.

Frettie (talkcontribs)
Bouzinac (talkcontribs)

no pb

Reply to "France and Prague"

New OpenRefine reconciliation service

4
Pintoch (talkcontribs)

Hi!

Thank you for wearing the {{User loves OpenRefine}} userbox on your user page!

Because the existing Wikidata reconciliation service has had severe performance issues recently, I have created a new one which should be faster and more robust. You can add it to OpenRefine in the reconciliation dialog with the following URL: https://wikidata.reconci.link/en/api (or by replacing en by any other language code).

If you have any issues with this new service, let me know.

Happy reconciling!

Bouzinac (talkcontribs)
Pintoch (talkcontribs)

Non, on ne la met plus à jour comme l'indique le premier paragraphe :)

Bouzinac (talkcontribs)

ah pardon, j'avais pas vu le premier paragraphe... ok!

Reply to "New OpenRefine reconciliation service"
VIGNERON (talkcontribs)

Bravo pour cet import des voies de Monaco ! J'ai quelques remarques :

J'ai aussi quelques questions :

  • je suis aussi étonné par surprises d'utilisations d'OpenRefine,
    • pour "avenue" j'imagine que tu n'a pas sélectionner la bonne classe d'élément
    • par contre, je ne vois pas du tout d'où viennent les « réconciliations où il ne détecte pas l'élément déjà créé », pourrais-tu m'en dire plus ?
    • as-tu aussi un exemple de doublons (je l'ai vu parfois passé pour QS mais jamais pour OR)
    • pour l'absence du code FANTOIR, j'imagine que ce sont de nouvelles voies, non ?
Bouzinac (talkcontribs)

salut

  • capitales de début : OK mais je n'ai jamais compris ce besoin de minuscules initiales en fr...
  • P131 : à part mettre Monaco, je n'ai pas de fichier qui permette d'indiquer le quartier administratif...

Openrefine :

  • avenue : possible. Autre exemple : https://www.wikidata.org/w/index.php?title=Q98925236&oldid=1271872013 :(
  • c'est à dire que si tu réconcilie "avenue truc" (je n'ai plus l'exemple exact en tête), il ne trouve pas l' "avenue truc" déjà existante, et du coup, tu crées l' "avenue truc"
  • Doublons uniquement QS : j'imagine que si le QS a plusieurs fichiers avec des CREATE en parallèle de plusieurs utilisateurs, il fait le doublon en déconnant...
  • Absence de Fantoir... j'en doute car Monaco est construite depuis un certain temps déjà et bcp de rues quandmême sans Fantoir. J'ai même apparemment la rue allée Saint Jean-Paul II(Q98924937) qui a changé de nom... bref, Fantoir ne semble pas franchement à jour vis à vis de Monaco.

Aurais tu de ton côté moyen d'enrichir avec la coordonnée GPS ? @+

VIGNERON (talkcontribs)

Merci !

Pour le libellé (et la description aussi d'ailleurs), ce sont simplement les règles habituelles du français, on écrit bien « La rue truc est une voie de machin » et pas « La Rue truc est une Voie de machin ». Mettre une capitalisation correct permet de faciliter la réutilisation.

Pour le P131, dommage. Du coup, j'hésite : vaut-il mieux mettre juste Monaco (déjà présent dans pays) ou rien du tout. J'aurais plutôt tendance à choisir la première solution mais je te laisse voir.

Pour OpenRefine :

  • oui, clairement c'est un problème de classe de réconciliation mal choisie (ou bien pas du tout choisie ?), cela arrive parfois
  • ça c'est très étrange par contre, si c'est le même nom il devrait pouvoir le trouver même dans le pire des cas il me semble... (et encore plus ici si tu réconcilies avec un pays petit comme Monaco)
  • oui, QS déconne parfois (pas que sur les créations), c'est la raison principale pour laquelle j'utilise maintenant presque uniquement OR pour créer des éléments
  • oui, FANTOIR est une ressource très riche mais imparfaite (et pas que pour Monaco), par « récent » cela peut parfois être un temps assez long (une rue de Rennes crée vers 2009 n'est entrée dans le FANTOIR qu'en 2019 :/ ). Cela reste une ressource à utiliser mais c'est pourquoi j'insiste régulièrement sur le besoin de croiser avec d'autres sources.

Pour les coordonnées GPS, à part le faire à la main, je n'ai pas d'idée.

Bouzinac (talkcontribs)

Je n'ai jamais vu ce besoin de capitalisation côté anglais. Voir par ex Baker Street(Q804402) :) En cas de réutilisation, pourquoi ne pas forcer la minusculisation avec une formule lcase(1er caractère)||reste de la phrase... Je fais parfois du QS car l'envoi de Openrefine vers Wikidata ne fonctionne pas : le compteur reste bloqué à 0%, je n'ai jamais bien compris pourquoi mais je soupconne que plus le schéma OR est complexe, plus il bugge à l'envoi vers WD.

VIGNERON (talkcontribs)

L'anglais fonctionne très différemment du français. Non, forcer la « minusculisation » est une très mauvaise idée, pense à une phrase comme « l'état de l'État est dû à l'église de l'Église » ou bien « je mange un opéra(1858875) à Opéra(1392037) », la présence d'une minuscule a un sens qu'il est impossible d'automatiser d'où le besoin.

Pour OR qui semble rester bloqué à 0 %, cela m'arrive souvent mais en général, il suffit d'attendre (parfois 2 minutes, parfois jusqu'à 15 minutes, cela dépend du volume de données que l'on traite).

Bouzinac (talkcontribs)

Et c'est dans quel contexte de réutilisation ? Que dirais tu d'envoyer sur WD les rues Fantoir du département franco français 06 ?

VIGNERON (talkcontribs)

Euh, pour tout les contextes. Ce sont les règles générale d'écriture (du français en l'occurrence mais de nombreuses autres langues ont une fonctionnement similaire, je me rends compte que mon exemple marche aussi en anglais : « the state of the State is due to the church of the Church », pas pour les noms propres ceci dit).

Cela me gêne d'importer uniquement en se basant sur FANTOIR mais si tu croises avec d'autres sources de données, alors aucun problème.

Bouzinac (talkcontribs)

Par contexte, je voulais dire via quel traitement informatique/outil réutilisant le label fr wikidata ?

VIGNERON (talkcontribs)

Je maintiens : dans tout les contextes. Pour prendre exemple courante : les infoboxes (en général c'est invisible car les mots sont en première position et donc recapitaliser mais pas toujours, pas pour les qualificateurs notamment). De toute façon peu importe, il est nécessaire que les libellés soient corrects, y compris typographiquement (personne ne songerait à y introduire une faute d'orthographe mais étrangement une faute de typographie est considérée comme moins grave...).

Bouzinac (talkcontribs)

OK, dans une infobox. Tu aurais un exemple d'infobox où le titre de l'article doit être utilisé en phrase plutôt qu'en simple titre ?

Jura1 (talkcontribs)

S'il n'y a pas de numéro, je crois que la nom d'une rue prend une majuscule ..

VIGNERON (talkcontribs)

Non, justement après un numéro de voie on utilise une minuscule. C'est justement le cas des adresses dans les infoboxes, voir fr:Caserne du Bon Pasteur pour ne prendre qu'un exemple parmi des milliers.

PS: Jura1 étant intervenu dans cette discussion, je ne peux plus la poursuivre. Bon courage pour la suite.

Bouzinac (talkcontribs)

ok pour l'exemple/contexte de réutilisation du libellé, merci!

Embassy of Canada, Washington, D.C.

4
Palotabarát (talkcontribs)
Palotabarát (talkcontribs)

You didn't answer that. This is not correct. Undo is not an argument! Palotabarát (talk) 22:44, 18 September 2020 (UTC)

Bouzinac (talkcontribs)
Palotabarát (talkcontribs)

quartiers ordonnancés et secteurs réservés

2
Jura1 (talkcontribs)

Afin d'améliorer les éléments pour le découpage territorial, il y a maintenant:

C'était la partie simple.

Pour quartiers, j'ai créé deux éléments:

Les quartiers de Moneghetti et Monte-Carlo ayant considérablement changés, il y a maintenant des éléments pour avant et pour après. On devrait pouvoir les utiliser pour des immeubles .. reste à corriger quelques liens.

Reste fr:ISO_3166-2:MC, dont je ne sais quoi faire. On pourrait également tenter d'inclure fr:Quartiers_de_Monaco#Quartiers_traditionnels.

@Poulpy: qui en a déjà créé il y a quelque temps. Qu'en penses-vous?

Jura1 (talkcontribs)
Arorae (talkcontribs)

Bonjour : en ce qui me concerne un nom officiel dans Wikidata est un « nom officiel » dans les langues officielles du pays. Le français n’est en rien officiel aux Kiribati — mais je me trompe peut-être pour la définition de cette donnée…

Bouzinac (talkcontribs)

Bonjour Oui, mais le pb de la propriété official name (P1448) est que, selon sa définition Wikidata, qu'elle ne permet pas en principe le stockage du nom officiel (quelque soit la langue), uniquement dans la/les langues du lieu. Mais il n'existe pas d'autres propriétés existantes le permettant. Donc en attendant mieux, j'utilise cette propriété-là pour stockage du nom officiel (nom utilisé par des organismes officiels potentiellement extérieurs au pays). Ça peut être important pour des conflits de toponymies "locales". Donc par exemple https://www.wikidata.org/wiki/Q183#P1448....

Arorae (talkcontribs)

La propriété est bien «  official name of the subject in its official language(s) » et donc mon interprétation est bien celle qui serait la bonne. Je ne parle pas de la RFA pour laquelle la seule langue officielle est l’allemand. Il faudrait créer une propriété ad hoc (noms recommandés dans d’autres langues), car la définition même de « nom officiel » fait fi des exonymes qui sont rarement officiels (je viens de relire la page du CNIG qui est pleine d’erreurs ou d’approximations et qui a été rédigée par une commission de l’ING assez peu compétente pour fixer l’usage en français).

Bouzinac (talkcontribs)

Je suis d'accord mais comme il n'y a pas mieux, merci de laisser et on migrera ça vers une meilleure propriété. Il y a comme réf la CNIG qui est un organisme officiel, géré directement par le gouvernement et non pas une commision amicale de toponymie ou autre. On retrouve aussi le libellé sur la page de l'ambassade de france https://www.diplomatie.gouv.fr/fr/dossiers-pays/kiribati/relations-bilaterales/ Donc keep cool Ou alors faites-vous même le nettoyage sur toutes les pages de pays utilisant "trop" la P1148...

Arorae (talkcontribs)

« Keep cool » est davantage destiné à vos potes qu’à une discussion sur Wikidata. Je contribue sur Wikidata en mesure de mes capacités et ne suis pas en mesure de « nettoyer » les ajouts qui ne correspondent pas au libellé exact des propriétés. Une propriété dans un monde où cela peut être utilisé par des locuteurs de langues et de WP différentes doit être sobrement interprétée, pas de façon baroque. Et une source quand elle est (en partie) fautive ne doit pas être vue comme un texte sacré avec cette manie bien française que quand ça vient d’une commission officielle, c’est de meilleure qualité : eh bien non, même la CNIG se contredit parfois et fait des erreurs. Et pendant longtemps elle a indiqué que Kiribati était un féminin singulier avant de faire marche arrière … sur mon indication. La forme « république des Kiribati » (sans majuscule) est désormais celle conforme à l’usage et à l’étymologie du mot. Mais ce n’est en rien une forme officielle (comme ne le sont pas non plus les formes retenues dans leurs guides les Nations unies ou l’Union européenne). Sans compter le Québec souvent en contradiction avec la patrie de l’Académie.

Bouzinac (talkcontribs)
Jmh2o (talkcontribs)

A la suite de ton ajout sur "Charleroi", j'ai été vérifier dans la source, car de mémoire, les dates de débuts et de fin étaient incorrectes. J'ai ainsi pu compléter les informations concernant les noms révolutionnaires de Charleroi. Et par la même occasion j'ai ajouté l'information sur l'article de la Wikipédia en français. Grâce à toi ;)

Arpyia (talkcontribs)

Bonjour,

Il ne faut pas fusionner les communes (qui sont des entités administratives) et les localités (qui sont des entités géographiques). Les communes ont souvent le même nom que leur localité principale mais ce sont deux notions différentes.

Arpyia (talkcontribs)

Autre remarque que je vois encore sur certains éléments comme Q838343 : attention à ne pas ajouter d'informations fausses. Sauf indication contraire, les décrets entrent en vigueur le lendemain de leur publication !

Bouzinac (talkcontribs)
Mahir256 (talkcontribs)
Bouzinac (talkcontribs)

Mistake... for an unknown reason, Openrefine reconciled some data to wrong items, didn't check enough before the quickstatement

Obrežje/Bregana border crossing

5
Upwinxp (talkcontribs)
Bouzinac (talkcontribs)

hello, no they shouldn't because they don't belong to the same country. One building for country A and one for country B (see for instance embassies). This can be easily understood with : https://query.wikidata.org/#%23defaultView%3AMap%0ASELECT%20distinct%20%3Fitem%20%3FitemLabel%20%3Fcoord%20WHERE%20%7B%0A%20%20SERVICE%20wikibase%3Alabel%20%7B%20bd%3AserviceParam%20wikibase%3Alanguage%20%22%5BAUTO_LANGUAGE%5D%2Cen%22.%20%7D%0A%20%20%3Fitem%20wdt%3AP31%20wd%3AQ757292%20.%23checkpoints%0A%20%20%3Fitem%20wdt%3AP361%2a%2Fwdt%3AP31%2Fwdt%3AP279%2a%20wd%3AQ67371697%20.%20%23located%20on%20a%20Schengen%20border%0AMINUS%20%7B%20%3Fitem%20wdt%3AP576%20_%3Ab2.%20%7D%20%23Remove%20dissolved%0AMINUS%20%7B%20%3Fitem%20wdt%3AP361%20wd%3AQ17163396.%20%7D%20%23Remove%20open%20borders%0AMINUS%20%7B%20%3Fitem%20wdt%3AP361%20wd%3AQ3089219.%20%7D%20%23Remove%20maritime%20borders%0AMINUS%20%7B%20%3Fitem%20wdt%3AP361%20wd%3AQ700754.%20%7D%20%23Remove%20RFA-RDA%20borders%0AMINUS%20%7B%20%3Fitem%20wdt%3AP361%20wd%3AQ67218438.%20%7D%20%23Remove%20air%20borders%0AMINUS%20%7B%20%3Fitem%20wdt%3AP361%20wd%3AQ67457910.%20%7D%20%23Remove%20municipal%2Fcities%20borders%0AOPTIONAL%20%7B%20%3Fitem%20wdt%3AP625%20%3Fcoord.%20%7D%0A%7D regards

Upwinxp (talkcontribs)

Thanks, I didn't know about buildings having separate Wikidata items, but at least the Wikipedia articles must be put together.

Bouzinac (talkcontribs)

No pb. I don't know since the slovenian page look to be speaking about only slovenian border ; whilst the croatian page looks to be speaking about both borders.

Upwinxp (talkcontribs)

It's not the Croatian page but Czech, and both speak about the border crossing as a whole (like, one border crossing - two names - two checkpoints).