About this board

Previous discussion was archived at User talk:Pintoch/Archive 1 on 2017-06-21.

Eihel (talkcontribs)

Bonjour,

Les nouvelles traductions en français sont faites pour OR et j'ai aussi vérifié toutes les autres traductions en français. @Thadguidry

À+

Pintoch (talkcontribs)

Merci beaucoup ! :)

2405:3800:8AD:12AF:5D6:E576:45C4:E46A (talkcontribs)

Vhttps://creativecommons.org/licenses/by-sa/3.0/

Ozmorph (talkcontribs)
Simon Villeneuve (talkcontribs)

Bonjour,

J'espère que l'année commence bien pour toi !

J'aurais 3 questions à propos d'OpenRefine pour toi :

1- D'abord, je me retrouve parfois avec des cellules multi-évaluées. J'arrive bien à les séparer, ce qui crée une ligne supplémentaire pour l'entrée supplémentaire. Cependant, je ne sais pas comment arranger les choses pour que la valeur de cette ligne supplémentaire soit associée au même élément que la ligne précédente. Ainsi, par exemple, ici, j'aimerais que le nom de famille "Bibeau" soit associé à la même entrée que la ligne du nom de famille "Cournoyer" précédente.

2- Je tente de réconcilier des personnalités avec ce même fichier, mais OR ne me donne aucun résultats. J'obtiens ainsi environ 540 "none" et 20 "unreconcilied" sur l'ensemble des 560 entrées. Pourtant, quand je fais une recherche manuelle, soit je trouve les bonnes personnes (exemple), soit je trouve des homonymes (exemple). Dans les deux cas, OR aurait dû m'offrir de les réconcilier et je ne comprends pas pourquoi il ne détecte pas ces labels. J'ai sélectionné "Wikidata (fr)", puis "être humain". J'ai ajouté les valeurs réconciliées d'une autre colonne pour "pays de citoyenneté" et j'ai remplacé les espacements entre prénoms et noms par une barre de soulignement, mais ça ne change rien.

3- Enfin, si je veux ajouter une colonne de valeurs d'un fichier .csv à un fichier OR déjà existant, tu peux me pointer la doc qui dit comment m'y prendre ? Je suis conscient que cette dernière question est probablement triviale et n'hésite pas à ne pas y répondre si ça te fait perdre du temps.

Pintoch (talkcontribs)

Salut ! Bonne année à toi aussi :)

1 - Tu peux utiliser la fonction "Fill down" (je sais plus comment elle est traduite). Pour annuler ses effets tu peux utiliser "Blank down". Ça vaut le coup de faire "Fill down" juste avant de générer tes edits, parce qu'en faisant ça tu perds ta structure de record.

2 - Utilise https://wikidata.reconci.link/fr/api plutôt que https://wdreconcile.toolforge.org/fr/api

3 - Pas de méthode miracle… Si tu as exactement autant de lignes, tu peux importer le CSV dans un nouveau projet et utiliser la fonction cross pour faire une jointure sur les numéros de ligne, je pense (quite à les ajouter en tant que colonne explicite dans le nouveau projet, si c'est pas supporté nativement).

Simon Villeneuve (talkcontribs)

Hey, merci beaucoup !

1- J'ai tenté l'approche expliquée ici. Malheureusement, pour une raison que j'ignore, ça n'a pas marché (la version ligne de commande générale pour l'ensemble des colonnes). J'ai donc fait ça pour chaque colonne individuellement et ça fonctionne !

2- Ça marche bien mieux ! Merci du tuyau.

3- Je pense que je vais exporter en format .xls, copier-coller la colonne manquante et réimporter le fichier résultant dans OR. Ça demande plus de manip et ça m'oblige à ajouter une colonne avec les identifiants de réconciliation, mais c'est un chemin qui me semble moins inconnu.

Merci encore !

Simon Villeneuve (talkcontribs)

Coucou,

J'aurais encore 2 questions pour toi :

1- Si je dois créer des nouveaux éléments, mais qu'avec des cellules multi-évaluées divisées, je me retrouve avec plusieurs fois le même nom sur plusieurs lignes consécutives, comment puis-je éviter qu'un élément soit créé pour chacune d'elles ? Je veux qu'il soit seulement créé pour la première, puis que les données des lignes suivantes soient associées à cet élément créé.

2- Y a-t-il un moyen de faire enregistrer le numéro des éléments nouvellement créés sur Wikidata dans OpenRefine ? Pour le moment, le seul moyen que j'ai trouvé pour retrouver les numéros des éléments créés est de réconcilier à nouveau mon fichier une fois le schéma importé.

Pintoch (talkcontribs)

Salut Simon,

1 - Oui, tu peux utiliser l'option "Create one new item for similar cells"

2 - Oui, quand tu fais les edits sur Wikidata, les cellules marquées comme correspondant à un nouvel item se transforment en cellules réconciliées vers un item existant. Tu peux ensuite en extraire le Qid (par exemple avec l'expression `cell.recon.match.id`).

Simon Villeneuve (talkcontribs)

Merci pour ta réactivité et ta précision. J'apprécie beaucoup.

Bonne dimanche !

Reply to "Question OpenRefine"
NguoiDungKhongDinhDanh (talkcontribs)

Hi, is it possible to render a list of items edited via EditGroups?

Pintoch (talkcontribs)

Hi!

You could do this with a little script which would query the EditGroups API. For instance, this lists the edits in one of your batch: https://editgroups.toolforge.org/api/b/QSv2/73100/edits/ You can iterate through this by following the links in the `next` field, and gather the set of edited pages.

Would it be easier if the tool offered the possibility to download an entire batch as a CSV file?

NguoiDungKhongDinhDanh (talkcontribs)

Yes, downloading would be a lot easier for me. Thank you in advance.

Pintoch (talkcontribs)
Reply to "List of items"
Pyfisch (talkcontribs)

Hi, just to let you know the current lag is 3 days, 5:16:05 (278165 seconds).

Pintoch (talkcontribs)

Thanks! It should be fixed in a few hours.

Pyfisch (talkcontribs)

again: the current lag is 1 day, 2:23:18 (94998 seconds)

Ameisenigel (talkcontribs)

Hi, the current lag is 2 days, 3:58:04 (187084 seconds)

Pintoch (talkcontribs)

Sorry about this and thanks for letting me know!

Jflarsric (talkcontribs)

The current lag is 1 day, 2:50:42 (96642 seconds)

Pintoch (talkcontribs)

Hi! Thanks, yes I am aware of the problem and working on it, hopefully the problem should be resolved in the coming days.

Reply to "3 days EditGroups lag"
Mormegil (talkcontribs)

Hi! As the EditGroups tool reports “if this is more than an hour then something is probably wrong - please notify the maintainers of the tool”, I’m notifying that the current lag is 1 day, 3:11:03 (97863 seconds)…

Pintoch (talkcontribs)

Hi! Thanks, yes I am aware of the problem and working on it, hopefully the problem should be resolved in the coming days.

Reply to "EditGroups lag"
HughLilly (talkcontribs)
Pintoch (talkcontribs)

Call for participation in the interview study with Wikidata editors

1
Kholoudsaa (talkcontribs)

Dear Pintoch,

I hope you are doing good,

I am Kholoud, a researcher at King’s College London, and I work on a project as part of my PhD research that develops a personalized recommendation system to suggest Wikidata items for the editors based on their interests and preferences. I am collaborating on this project with Elena Simperl and Miaojing Shi.

I would love to talk with you to know about your current ways to choose the items you work on in Wikidata and understand the factors that might influence such a decision. Your cooperation will give us valuable insights into building a recommender system that can help improve your editing experience.  

Participation is completely voluntary. You have the option to withdraw at any time. Your data will be processed under the terms of UK data protection law (including the UK General Data Protection Regulation (UK GDPR) and the Data Protection Act 2018). The information and data that you provide will remain confidential; it will only be stored on the password-protected computer of the researchers. We will use the results anonymized (?) to provide insights into the practices of the editors in item selection processes for editing and publish the results of the study to a research venue. If you decide to take part, we will ask you to sign a consent form, and you will be given a copy of this consent form to keep.

If you’re interested in participating and have 15-20 minutes to chat (I promise to keep the time!), please either contact me at kholoudsaa@gmail.com or use this form https://docs.google.com/forms/d/e/1FAIpQLSdmmFHaiB20nK14wrQJgfrA18PtmdagyeRib3xGtvzkdn3Lgw/viewform?usp=sf_link with your choice of the times that work for you.

I’ll follow up with you to figure out what method is the best way for us to connect.

Please contact me using the email mentioned above if you have any questions or require more information about this project.

Thank you for considering taking part in this research.

Regards

Kholoud

Wikidata property for an identifier : Property:P5242

2
WKPDA3 (talkcontribs)

Hi Pintoch, P5242 property no longer works (404 error). The url seems to have changed :

Old : http://www.shanghairanking.com/World-University-Rankings/$1.html

New : http://www.shanghairanking.com/institution/$1

Can you fix this bug? Thanks :)

Pintoch (talkcontribs)

Hi! You should be able to change the formatter url yourself - do you want to give it a try? Thanks!

Stevenliuyi (talkcontribs)

Hello! It's just a notification that I nominated this property for deletion since it is identical to bilibili ID (P5733).

Reply to "P6453"